- BrainTools - https://www.braintools.ru -

Разбираемся, где на самом деле проходит потолок возможностей современных моделей и какие задачи останутся за человеком в ближайшие годы.
P.S Если вам интересна тема AI-агентов и внедрения нейросетей, заглядывайте в мой Telegram-канал ДругОпенсурса [1]. Там я публикую свежие новости и разборы инструментов в числе первых.
Чтобы понять, насколько заменим тот или иной специалист, применяется модель четырех зон. Она помогает классифицировать любую работу по степени сложности её передачи алгоритму.
Это максимально структурированные задачи с низким уровнем неопределенности. Ввод данных, базовая сортировка документов, простые транзакции.
Статус : Текущий ИИ справляется с этим отлично. Здесь экономия FTE (эквивалента полной занятости) максимальна.
Задачи, где есть четкие инструкции, но требуется координация и отслеживание контекста. Например, обработка стандартных страховых случаев или базовый тикетинг в техподдержке.
Статус: Агентные системы при правильной архитектуре закрывают эти задачи на 70-80%.
Здесь начинаются проблемы. Это аналитическая работа, где правильный ответ зависит от контекста, который невозможно прописать в инструкции. Юридические заключения по сложным спорам, проектирование архитектуры ПО, финансовый анализ в условиях волатильного рынка.
Статус: Текущие LLM здесь работают как револьвер с одним патроном. Пять раз они выдают блестящий результат, а на шестой совершают критическую ошибку [2], которая обнуляет всю выгоду. Это зона высокого риска.
Стратегическое управление, этические решения и юридическая ответственность за результат.
Статус: Здесь нужен биологический пульс. Мы пока не готовы делегировать право подписи и ответственность за последствия вероятностному распределению токенов.

Для анализа реального положения дел было выбрано 10 стандартных офисных ролей, которые были декомпозированы на 127 атомарных задач. В качестве базы использовались международные классификаторы профессий O*NET и ESCO. Каждая задача соотнесена с одной из четырех зон автоматизации.
Среднее распределение по всем исследованным ролям показало следующие результаты:
Зона I – 12%.
Зона III – 44%.
Вопреки громким заголовкам в медиа, большая часть работы сосредоточена в там, где ИИ на текущем этапе развития либо бесполезен, либо риск его использования не оправдан.
Для опытных инженеров результаты оказались наиболее показательными: 83% их задач относятся к Зоне III. Проектирование систем, отладка нетривиальных багов и согласование требований с заказчиком – это задачи, требующие глубокого контекстного анализа, а не простого написания кода.
Для Junior-позиций наблюдается обратная картина. Написание бойлерплейта и реализация простых фич – это задачи Зон I и II. Именно поэтому входной билет в индустрию становится дороже: ИИ постепенно поглощает ту работу, на которую традиционно обучались новички.
В работе юридических советников доля задач из Зон III и IV составила почти 100%. Практически любая активность в этой сфере требует либо интерпретации прецедентов в специфическом контексте, либо несения прямой ответственности за риски.
Секретари и ассистенты обладают самым высоким потенциалом автоматизации, около 55% их рабочего времени занимают задачи из Зоны I : бронирование, форматирование, работа с расписанием. Однако оставшиеся 45% задач связаны с политическим маневрированием и пониманием приоритетов руководителя, которые пока недоступны для алгоритмов.

При внедрении ИИ-агентов организации часто сталкиваются с двумя критическими факторами, которые редко учитываются в маркетинговых демо-версиях:
Генерация сложных цепочек рассуждений требует огромного количества токенов. Если агент расходует 2000 токенов там, где архитектурно можно было обойтись 500, в масштабах корпорации это выливается в неоправданные счета от провайдеров LLM.
Если ИИ допускает ошибки в 15% случаев в Зоне III, компании требуется высококвалифицированный эксперт для верификации каждого результата. Зачастую стоимость такой проверки превышает стоимость выполнения задачи человеком с нуля.

Должности сохранятся, но их внутреннее наполнение изменится. Рутинные операции перейдут машинам, а фокус человеческой деятельности сместится в сторону экспертных суждений
Начинающим специалистам в IT и аналитике необходимо форсировать переход к задачам Зоны III. Навыка просто писать код или составлять отчеты становится недостаточно для конкуренции на рынке.
Промышленная эксплуатация ИИ будет развиваться не в сторону самых умных моделей, а в сторону нейро-символических систем. В них гибкость нейросетей жестко ограничена логическими правилами и внешними контурами проверки.

Автор: Qwertcoser
Источник [3]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/29270
URLs in this post:
[1] ДругОпенсурса: https://t.me/tch_net
[2] ошибку: http://www.braintools.ru/article/4192
[3] Источник: https://habr.com/ru/articles/1027110/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1027110
Нажмите здесь для печати.