- BrainTools - https://www.braintools.ru -
Два года назад все хотели агента, который «сам пишет код, сам его тестирует и сам деплоит в прод».
Сейчас 2026 год. Давайте честно поговорим о том, что из этого взлетело, а что тихо умерло в корпоративных slack-каналах под сообщениями «окей, пока притормозим с агентами».
Обещание было простым и красивым: дайте LLM инструменты и цель — она сама разберётся. Никаких скриптов, никаких хардкоженых цепочек. Агент думает, планирует, и действует.
Фреймворки росли как грибы:
LangChain — первый мейнстримный, стал символом эпохи и предметом мемов одновременно
AutoGen — Microsoft, мультиагентные диалоги, «посмотрите как агенты сами между собой договариваются»
CrewAI — «команды» агентов с ролями, как в корпоративной оргструктуре
LlamaIndex — RAG + агенты, серьёзный инструментарий для работы с данными
Haystack, SuperAGI, AgentGPT — и ещё двадцать названий, которые вы уже не помните
На GitHub — тысячи звёзд. На ProductHunt — лонч за лончем. В соцсетях — демо, где агент «за ночь пишет SaaS».
Я не буду говорить, что всё провалилось. Скажу, что реальность оказалась значительно скромнее.
Первое, с чем столкнулись все — это то, что агенты работают… иногда. Запускаешь один и тот же таск пять раз — три раза успешно, один раз агент уходит в бесконечный loop, ещё раз галлюцинирует инструмент которого не существует и уверенно отчитывается об успехе.
В скрипте с детерминированной логикой [1] у вас 0 или 1. В агентной системе — вероятность. А вероятность в проде это headache на продакшене.
Цепочки агентских вызовов — это не дёшево. Один «умный» агент мог за ночь сжечь бюджет токенов, который планировался на месяц. Особенно весело, когда агент застревал в петле из трёх вызовов и молотил по API до таймаута или до вашего утреннего алерта.
Что именно агент делал последние 40 секунд? Почему он решил вызвать именно этот инструмент? Почему ответ в этот раз другой?
Дебаггинг агентов в 2024–2025 был унизительным занятием. Ты смотришь в логи, которые выглядят как поток сознания, и пытаешься понять где именно что-то пошло не так.
LangChain заслуживает отдельного абзаца. Он стал жертвой собственного успеха: слишком быстро рос, слишком часто ломал API, слишком много абстракций поверх абстракций. В какой-то момент сообщество начало делиться на «тех кто на LangChain» и «тех кто уже переписал с нуля».
К 2025 году появился LangGraph — попытка исправить ситуацию через явное управление состоянием. Это реально лучше. Но осадок остался.
Здесь становится интереснее. Рынок не умер — он отсеялся.
Самое важное открытие: агентные концепции работают, агентные фреймворки часто оверинжинирингованы.
Компании, которые получили реальный результат, в большинстве случаев написали своих «агентов» — по сути простые конечные автоматы поверх LLM API. Никакого LangChain, никакого CrewAI. Просто: prompt → tool call → check result → next step.
Если честно, большинство задач, для которых люди тянулись к агентам, решались банальным RAG и хорошо написанными системными промптами. Агент казался мощнее, но RAG работал надёжнее.
Структурированный вывод (function calling, JSON mode) убил отдельный класс агентных сценариев — там где агент «решал» как структурировать ответ, теперь это просто делает модель детерминированно.
Эти два инструмента к 2026 году заняли нишу серьёзного инструментария:
LangGraph — если вам нужны реальные агентные сценарии с явным графом переходов, и человеческим контролем. Сложно учить, но работает предсказуемо.
LlamaIndex — если ваша задача про данные: сложный RAG, работа с документами, поиск по корпоративной базе знаний. Здесь он не имеет реальных конкурентов.
Model Context Protocol — это, пожалуй, самое важное инфраструктурное решение последних двух лет в этой нише. Вместо того чтобы каждый фреймворк изобретал свой формат инструментов, появился стандарт.
Теперь вы пишете MCP-сервер один раз — и он работает с любым клиентом. Это та самая унификация, которой не хватало. Экосистема MCP-серверов растёт быстро, и это хороший знак.
Пока все смотрели на облачные GPT-агенты, Ollama + локальные модели тихо стали серьёзной альтернативой для корпоративных сценариев, где данные не уходят в облако. Плюс — никаких биллинговых сюрпризов.
За эти годы индустрия собрала коллекцию граблей. Запишите:
«Оркестратор оркестраторов» — когда один агент управляет другими, которые управляют третьими. Выглядит умно на схеме, работает ужасно на практике. Ошибки [2] мультиплицируются, latency растёт экспоненциально.
«Инструмент на все случаи жизни» — агент с 30+ инструментами. Модель теряется, выбирает неправильный, уверенно отчитывается. Правило: не больше 5–7 инструментов на одного агента. Лучше несколько специализированных агентов.
«Доверяй, не проверяй» — агент вызвал инструмент, получил результат, пошёл дальше. Без валидации, без retry-логики. В демо работает, в проде ломается на третьем вызове.
«Stateless по умолчанию» — забыть про управление состоянием и потом удивляться, почему агент не помнит что делал три шага назад.
Честный список use-cases, которые уже в продакшене и не вызывают стыда:
Код-ревью и автофикс — GitHub Copilot, Cursor, Claude Code. Это и есть агенты, просто хорошо упакованные.
Обработка документов — извлечение данных из PDF/контрактов/счетов с верификацией. Надёжно, потому что результат проверяемый.
Customer support первой линии — с жёстким ограничением скоупа и human handoff.
Мониторинг и алертинг — агент смотрит на метрики, формулирует summary, предлагает action items. Человек принимает решение.
Внутренние Q&A системы — по базе знаний компании. Классический RAG-агент, работает отлично.
Несколько трендов, за которыми стоит следить:
Специализация вместо универсальности. Хайп вокруг «AGI-агента, который делает всё» спадает. Побеждают узкоспециализированные агенты с чётким скоупом. Coding agent — отдельно, data agent — отдельно.
Computer use как новый фронтир. Агенты, управляющие браузером и десктопными приложениями — это следующая волна. Пока ненадёжно, но прогресс быстрый.
Меньше фреймворков, больше протоколов. MCP в частности. Индустрия движется к стандартизации интерфейсов, а не к экосистемам закрытых фреймворков.
Edge и локальные агенты. С ростом качества малых моделей — агенты без облака становятся реальностью для чувствительных данных.
Агентные фреймворки не провалились. Они прошли через то, через что проходит любая новая технология: хайп → разочарование → реалистичное применение.
Революции не случилось. Но эволюция [3] — точно. Мы научились:
Делать агентов проще и надёжнее
Не злоупотреблять агентностью там, где хватает скрипта
Измерять и мониторить то, что раньше было чёрным ящиком
Ставить человека в контур там, где ставки высоки
Если вы активно используете агентные системы в продакшене — расскажите в комментариях, что у вас работает, а что нет. Живой опыт [4] ценнее любых бенчмарков.
Автор: Claritas
Источник [5]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/31001
URLs in this post:
[1] логикой: http://www.braintools.ru/article/7640
[2] Ошибки: http://www.braintools.ru/article/4192
[3] эволюция: http://www.braintools.ru/article/7702
[4] опыт: http://www.braintools.ru/article/6952
[5] Источник: https://habr.com/ru/articles/1041274/?utm_campaign=1041274&utm_source=habrahabr&utm_medium=rss
Нажмите здесь для печати.