multi-agent.

Анатомия production AI агента: разбор двух открытых промптов Anthropic

Год назад, в мае 2025, инженеры Anthropic вышли на Code w/ Claude с докладом «Prompting for Agents». Семь принципов промптинга, публичный workbench в браузере, пара примеров системных инструкций — этого было достаточно, чтобы собрать рабочего агента. Через месяц, 15 июня 2026, Anthropic выводит из эксплуатации модели claude-sonnet-4-0 и claude-opus-4-0 — те самые, на которых строился публичный workbench из того доклада.

продолжить чтение

Два окна в работе с AI-агентами: архитектор и разработчик. Самый недооценённый паттерн

Самый рабочий паттерн в работе с AI-агентами на код — два окна. Одно с архитектором/проверяющим, второе с разработчиком. Можно собрать на одной модели: Claude в обоих окнах с разными системными промптами и сессиями. Можно смешать — у меня сейчас Claude Code в окне разработчика и GPT-5.5 в режиме высокого мышления в окне архитектора. Модель важна меньше, чем разделение ролей.Почему один агент почти всегда хуже двух, что делает каждое из окон, и где этот паттерн избыточен.Почему один агент — это плохо

продолжить чтение

Как мы перешли на Opus и стали платить меньше

На прошлой неделе мы писали о том, как скармливали терабайты CI-логов LLM. Большинство вопросов на Hacker News касались не самих логов — спрашивали про агента: какие модели, как они взаимодействуют и во сколько всё это обходится.Сейчас мы работаем на Opus 4.6 и платим меньше, чем когда всё крутилось на Sonnet 4.0.Причина в основном в том, чего Opus не делает: 80% сбоев до него не доходят, а когда доходят — он не читает ни одной строки лога.Архитектура выглядит так:

продолжить чтение

Несколько Клодов над одним проектом: locks, handoffs и email 1982 года

Я работаю с Claude Code параллельно на трёх подписках Pro. Плюс коллеги на своих мульти-аккаунтах, часто в тех же файлах, часто в один и тот же день.Когда мне надоело каждый новый чат заново пересказывать Claude’у курс дел - я придумала handoff’ы: короткую сводку, которую сессия пишет в конце и которую следующая читает при старте.Когда на долгих проектах handoff’ов накопилось по восемьдесят штук и новая сессия тратила полчаса на «как мы сюда вообще пришли» - я придумала rollup’ы: один handoff, который сворачивает двадцать предыдущих. Цепочка rollup’ов на длинной дистанции становится летописью проекта.

продолжить чтение

Kimi выпустили открытую модель K2.6 для долгих задач по программированию

Moonshot AI представила Kimi K2.6 — открытую модель, заточенную под длинные задачи в программировании и агентные сценарии. В компании утверждают, что новая версия лучше справляется с многошаговой работой: может дольше удерживать контекст, чаще корректно вызывать инструменты и эффективнее координировать несколько субагентов.

продолжить чтение

Что такое Harness? Полный разбор на примере Claude Code, OpenAI и LangChain

Глубокий разбор того, что на самом деле строят Anthropic, OpenAI, Perplexity и LangChain. Оркестрационный цикл, инструменты, память, управление контекстом — и всё остальное, что превращает stateless LLM в работающего агента.Допустим, вы собрали чатбот. Может, даже прикрутили ReAct-цикл с несколькими инструментами. На демо работает. Но стоит попробовать сделать что-то production-grade — и всё начинает сыпаться: модель забывает, что делала три шага назад, вызовы инструментов падают без ошибок, контекстное окно забивается мусором.Проблема не в модели. Проблема во всём, что её окружает.

продолжить чтение