Два года назад все хотели агента, который «сам пишет код, сам его тестирует и сам деплоит в прод».
Сейчас 2026 год. Давайте честно поговорим о том, что из этого взлетело, а что тихо умерло в корпоративных slack-каналах под сообщениями «окей, пока притормозим с агентами».
Что нам обещали (и чего мы хотели)
Обещание было простым и красивым: дайте LLM инструменты и цель — она сама разберётся. Никаких скриптов, никаких хардкоженых цепочек. Агент думает, планирует, и действует.
Фреймворки росли как грибы:
-
LangChain — первый мейнстримный, стал символом эпохи и предметом мемов одновременно
-
AutoGen — Microsoft, мультиагентные диалоги, «посмотрите как агенты сами между собой договариваются»
-
CrewAI — «команды» агентов с ролями, как в корпоративной оргструктуре
-
LlamaIndex — RAG + агенты, серьёзный инструментарий для работы с данными
-
Haystack, SuperAGI, AgentGPT — и ещё двадцать названий, которые вы уже не помните
На GitHub — тысячи звёзд. На ProductHunt — лонч за лончем. В соцсетях — демо, где агент «за ночь пишет SaaS».
Что пошло не так
Я не буду говорить, что всё провалилось. Скажу, что реальность оказалась значительно скромнее.
Проблема 1: Надёжность как русская рулетка
Первое, с чем столкнулись все — это то, что агенты работают… иногда. Запускаешь один и тот же таск пять раз — три раза успешно, один раз агент уходит в бесконечный loop, ещё раз галлюцинирует инструмент которого не существует и уверенно отчитывается об успехе.
В скрипте с детерминированной логикой у вас 0 или 1. В агентной системе — вероятность. А вероятность в проде это headache на продакшене.
Проблема 2: Стоимость сюрпризов
Цепочки агентских вызовов — это не дёшево. Один «умный» агент мог за ночь сжечь бюджет токенов, который планировался на месяц. Особенно весело, когда агент застревал в петле из трёх вызовов и молотил по API до таймаута или до вашего утреннего алерта.
Проблема 3: Observability как тёмный лес
Что именно агент делал последние 40 секунд? Почему он решил вызвать именно этот инструмент? Почему ответ в этот раз другой?
Дебаггинг агентов в 2024–2025 был унизительным занятием. Ты смотришь в логи, которые выглядят как поток сознания, и пытаешься понять где именно что-то пошло не так.
Проблема 4: LangChain-проблема
LangChain заслуживает отдельного абзаца. Он стал жертвой собственного успеха: слишком быстро рос, слишком часто ломал API, слишком много абстракций поверх абстракций. В какой-то момент сообщество начало делиться на «тех кто на LangChain» и «тех кто уже переписал с нуля».
К 2025 году появился LangGraph — попытка исправить ситуацию через явное управление состоянием. Это реально лучше. Но осадок остался.
Что реально выжило и почему
Здесь становится интереснее. Рынок не умер — он отсеялся.
Выжил паттерн, а не фреймворк
Самое важное открытие: агентные концепции работают, агентные фреймворки часто оверинжинирингованы.
Компании, которые получили реальный результат, в большинстве случаев написали своих «агентов» — по сути простые конечные автоматы поверх LLM API. Никакого LangChain, никакого CrewAI. Просто: prompt → tool call → check result → next step.
RAG + структурированный вывод > агентные цепочки
Если честно, большинство задач, для которых люди тянулись к агентам, решались банальным RAG и хорошо написанными системными промптами. Агент казался мощнее, но RAG работал надёжнее.
Структурированный вывод (function calling, JSON mode) убил отдельный класс агентных сценариев — там где агент «решал» как структурировать ответ, теперь это просто делает модель детерминированно.
LangGraph и LlamaIndex — взрослые выжившие
Эти два инструмента к 2026 году заняли нишу серьёзного инструментария:
LangGraph — если вам нужны реальные агентные сценарии с явным графом переходов, и человеческим контролем. Сложно учить, но работает предсказуемо.
LlamaIndex — если ваша задача про данные: сложный RAG, работа с документами, поиск по корпоративной базе знаний. Здесь он не имеет реальных конкурентов.
MCP изменил правила игры
Model Context Protocol — это, пожалуй, самое важное инфраструктурное решение последних двух лет в этой нише. Вместо того чтобы каждый фреймворк изобретал свой формат инструментов, появился стандарт.
Теперь вы пишете MCP-сервер один раз — и он работает с любым клиентом. Это та самая унификация, которой не хватало. Экосистема MCP-серверов растёт быстро, и это хороший знак.
Локальные агенты — неожиданный победитель
Пока все смотрели на облачные GPT-агенты, Ollama + локальные модели тихо стали серьёзной альтернативой для корпоративных сценариев, где данные не уходят в облако. Плюс — никаких биллинговых сюрпризов.
Антипаттерны которые нужно знать
За эти годы индустрия собрала коллекцию граблей. Запишите:
«Оркестратор оркестраторов» — когда один агент управляет другими, которые управляют третьими. Выглядит умно на схеме, работает ужасно на практике. Ошибки мультиплицируются, latency растёт экспоненциально.
«Инструмент на все случаи жизни» — агент с 30+ инструментами. Модель теряется, выбирает неправильный, уверенно отчитывается. Правило: не больше 5–7 инструментов на одного агента. Лучше несколько специализированных агентов.
«Доверяй, не проверяй» — агент вызвал инструмент, получил результат, пошёл дальше. Без валидации, без retry-логики. В демо работает, в проде ломается на третьем вызове.
«Stateless по умолчанию» — забыть про управление состоянием и потом удивляться, почему агент не помнит что делал три шага назад.
Где агенты реально работают сегодня
Честный список use-cases, которые уже в продакшене и не вызывают стыда:
-
Код-ревью и автофикс — GitHub Copilot, Cursor, Claude Code. Это и есть агенты, просто хорошо упакованные.
-
Обработка документов — извлечение данных из PDF/контрактов/счетов с верификацией. Надёжно, потому что результат проверяемый.
-
Customer support первой линии — с жёстким ограничением скоупа и human handoff.
-
Мониторинг и алертинг — агент смотрит на метрики, формулирует summary, предлагает action items. Человек принимает решение.
-
Внутренние Q&A системы — по базе знаний компании. Классический RAG-агент, работает отлично.
Куда всё движется
Несколько трендов, за которыми стоит следить:
Специализация вместо универсальности. Хайп вокруг «AGI-агента, который делает всё» спадает. Побеждают узкоспециализированные агенты с чётким скоупом. Coding agent — отдельно, data agent — отдельно.
Computer use как новый фронтир. Агенты, управляющие браузером и десктопными приложениями — это следующая волна. Пока ненадёжно, но прогресс быстрый.
Меньше фреймворков, больше протоколов. MCP в частности. Индустрия движется к стандартизации интерфейсов, а не к экосистемам закрытых фреймворков.
Edge и локальные агенты. С ростом качества малых моделей — агенты без облака становятся реальностью для чувствительных данных.
Итого
Агентные фреймворки не провалились. Они прошли через то, через что проходит любая новая технология: хайп → разочарование → реалистичное применение.
Революции не случилось. Но эволюция — точно. Мы научились:
-
Делать агентов проще и надёжнее
-
Не злоупотреблять агентностью там, где хватает скрипта
-
Измерять и мониторить то, что раньше было чёрным ящиком
-
Ставить человека в контур там, где ставки высоки
Если вы активно используете агентные системы в продакшене — расскажите в комментариях, что у вас работает, а что нет. Живой опыт ценнее любых бенчмарков.
Автор: Claritas


