Как настроить AI-агента под проект: контекст, rules, skills, MCP — конспект двух вебинаров
Эта статья - выжимка двух наших апрельских вебинаров с разработчиком агента Михаилом Костицыным. По общим тезисам каждый может проверить выводы у себя.Записи вебинаров на RuTube: — Вебинар 1 — AI-инструменты для разработчиков 2026 — Вебинар 2 — Настройка проекта под агента
Alibaba Cloud выпустил HiClaw v1.1.0 — Hermes Agent стал first-class Worker runtime
Alibaba Cloud выпустил HiClaw v1.1.0 — оператор для AI-агентов на Kubernetes. Главное обновление: Hermes Agent стал полноценным Worker runtime. HiClaw позволяет через CRD управлять ресурсами агентов в стиле Kubernetes и поддерживает Matrix-интеграцию для координации. В новой версии добавлена Kubernetes-native архитектура, модульный runtime Hermes с возможностью программирования и дебаггинга, интерфейсы для gateway и storage, разделение контейнеров, режимы сна и миграции, а также CLI и приветственное сообщение. Продукт подходит как для enterprise, так и для малых команд, с возможностью локальной установки и замены компонентов (например, LLM и S3).Cocoon AI Summary
10 уроков агентного кодинга. Что делать в эпоху дешёвого кода?
Передовые модели сейчас действительно хорошо пишут код — лучше, чем справляются с большинством других задач. Работа с агентами ощущается как взгляд из будущего: полигон для проверки того, насколько далеко можно зайти с агентными возможностями. Это заряжает, даёт результат и при этом — откровенно странно ощущается.
Качество кода в эпоху AI: как не утонуть в багах и уязвимостях
Современные LLM генерируют код в разы быстрее разработчика, но «быстро» не значит «правильно»: модель может неверно понять задачу, внести логический баг, допустить уязвимость или сломать архитектуру проекта.
Claude вспомнил то, чего я ему не говорил. Полез разбираться. У него пять механизмов памяти
Открыл новую сессию Claude Code в проекте, который не трогал две недели. Спросил «как там клиент, на каком этапе работа». Claude ответил с такими деталями, которых я ему в этой сессии точно не давал. Имя ssh-хоста, где живёт dev-стенд. Срок до приёмки. Папку для задач в моём Projects.Я смотрю на ответ и думаю: я ему это не говорил. По крайней мере, сегодня.Полез смотреть, что у меня хранится в ~/.claude/. Нашёл папку memory/ с шестнадцатью markdown-файлами. Открыл, и там лежит про меня всё: контекст по клиентам, мои предпочтения по тону, серверные правила, истории провалов. Всё, что Claude когда-то услышал и решил, что стоит запомнить.
AI-агенты в продакшене: почему demo не равно реальность
Как я строил агента для код-ревью на LangGraph и где сломалась красивая теорияПару месяцев назад я смотрел демку: AI-агент получал пулл-реквест, пробегал по diff-у, находил потенциальный race condition и писал развёрнутый комментарий с предложением фикса. Всё это занимало около 40 секунд.В нашей команде ревью давно стало бутылочным горлышком. Двое сеньоров, около двенадцати PR в день, каждый висит в очереди по полдня. Идея автоматизировать первый проход — типовые замечания, проверки стайлгайда, очевидные ошибки — выглядела очень соблазнительно.
Triage-and-Voice: как опыт колл-центров даёт рабочий паттерн для LLM-продуктов
Почему саппорт-бот на LLM работает против васLLM одновременно решает две вещи: что сказать и как это сказать. Под давлением пользователя (эмоциональным или манипулятивным) вторая задача почти всегда побеждает. Модель начинает звучать максимально полезно и заботливо, и при этом врёт.Простым промптом это не вылечить. Более дорогая модель тоже не спасает. Проблема сидит глубже, в архитектуре.
Почему ваш LLM-бот врёт клиентам — и паттерн, который это чинит
Почему саппорт-бот на LLM работает против васLLM в саппорте одновременно решает две задачи: что сказать и как это сказать. Под давлением пользователя вторая всегда побеждает — модель звучит заботливо и при этом врёт. Промптом это не чинится.Дальше — два громких факапа, их общий корень и архитектурный паттерн Triage → Gate → Voice, который разделяет эти задачи.
Второй мозг строят все. Но большинство — не для себя
В моём инфо-пузыре последний месяц все строят второй мозг в Obsidian по методу Карпатого и рассказывают, как это повышает эффективность агентов. Гист прочитан, vault переформатирован, Claude подключён.Но никто особо не останавливается на вопросе: а для кого именно строится эта система — для агента или для себя? И есть ли вообще разница.
У ChatGPT и Claude уже есть память. Зачем тогда вокруг растут Mem0, Graphify и Karpathy-вики поверх Obsidian
Открываете ChatGPT или Claude после месячного перерыва, пишете «привет». Модель отвечает, обращаясь к вам по имени, помнит, что вы фуллстек на Python и Vue, что у вас был проект, в котором вы споткнулись о тонкость в логике вебхуков. Гугл-Gemini делает то же самое внутри своей экосистемы. Ровно сейчас, в апреле 2026, базовая память — стандартный feature в любом крупном чате. Никаких настроек, никаких фреймворков, никаких векторных баз. Включено по умолчанию.

