multi-agent.

Как мы проектировали multi-agent feedback для обучения рисованию

Дисклеймер. Я строю сервис AI-обратной связи для художников, поэтому это не обзор рынка и не сравнение «кто лучше». Это разбор продуктово-технического решения изнутри: какие компромиссы у multi-agent review, где он ломается, сколько стоит и как мы проверяли качество. Технические параметры и пороги — из нашего кода и рабочих метрик, а не из маркетинга.О чём речь

продолжить чтение

Оставлено в

Анатомия production AI агента: разбор двух открытых промптов Anthropic

Год назад, в мае 2025, инженеры Anthropic вышли на Code w/ Claude с докладом «Prompting for Agents». Семь принципов промптинга, публичный workbench в браузере, пара примеров системных инструкций — этого было достаточно, чтобы собрать рабочего агента. Через месяц, 15 июня 2026, Anthropic выводит из эксплуатации модели claude-sonnet-4-0 и claude-opus-4-0 — те самые, на которых строился публичный workbench из того доклада.

продолжить чтение

Оставлено в

Два окна в работе с AI-агентами: архитектор и разработчик. Самый недооценённый паттерн

Самый рабочий паттерн в работе с AI-агентами на код — два окна. Одно с архитектором/проверяющим, второе с разработчиком. Можно собрать на одной модели: Claude в обоих окнах с разными системными промптами и сессиями. Можно смешать — у меня сейчас Claude Code в окне разработчика и GPT-5.5 в режиме высокого мышления в окне архитектора. Модель важна меньше, чем разделение ролей.Почему один агент почти всегда хуже двух, что делает каждое из окон, и где этот паттерн избыточен.Почему один агент — это плохо

продолжить чтение

Оставлено в

Как мы перешли на Opus и стали платить меньше

На прошлой неделе мы писали о том, как скармливали терабайты CI-логов LLM. Большинство вопросов на Hacker News касались не самих логов — спрашивали про агента: какие модели, как они взаимодействуют и во сколько всё это обходится.Сейчас мы работаем на Opus 4.6 и платим меньше, чем когда всё крутилось на Sonnet 4.0.Причина в основном в том, чего Opus не делает: 80% сбоев до него не доходят, а когда доходят — он не читает ни одной строки лога.Архитектура выглядит так:

продолжить чтение

Оставлено в

Несколько Клодов над одним проектом: locks, handoffs и email 1982 года

Я работаю с Claude Code параллельно на трёх подписках Pro. Плюс коллеги на своих мульти-аккаунтах, часто в тех же файлах, часто в один и тот же день.Когда мне надоело каждый новый чат заново пересказывать Claude’у курс дел - я придумала handoff’ы: короткую сводку, которую сессия пишет в конце и которую следующая читает при старте.Когда на долгих проектах handoff’ов накопилось по восемьдесят штук и новая сессия тратила полчаса на «как мы сюда вообще пришли» - я придумала rollup’ы: один handoff, который сворачивает двадцать предыдущих. Цепочка rollup’ов на длинной дистанции становится летописью проекта.

продолжить чтение

Оставлено в

Kimi выпустили открытую модель K2.6 для долгих задач по программированию

Moonshot AI представила Kimi K2.6 — открытую модель, заточенную под длинные задачи в программировании и агентные сценарии. В компании утверждают, что новая версия лучше справляется с многошаговой работой: может дольше удерживать контекст, чаще корректно вызывать инструменты и эффективнее координировать несколько субагентов.

продолжить чтение

Оставлено в

Что такое Harness? Полный разбор на примере Claude Code, OpenAI и LangChain

Глубокий разбор того, что на самом деле строят Anthropic, OpenAI, Perplexity и LangChain. Оркестрационный цикл, инструменты, память, управление контекстом — и всё остальное, что превращает stateless LLM в работающего агента.Допустим, вы собрали чатбот. Может, даже прикрутили ReAct-цикл с несколькими инструментами. На демо работает. Но стоит попробовать сделать что-то production-grade — и всё начинает сыпаться: модель забывает, что делала три шага назад, вызовы инструментов падают без ошибок, контекстное окно забивается мусором.Проблема не в модели. Проблема во всём, что её окружает.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

multi-agent.

Как мы проектировали multi-agent feedback для обучения рисованию

Анатомия production AI агента: разбор двух открытых промптов Anthropic

Два окна в работе с AI-агентами: архитектор и разработчик. Самый недооценённый паттерн

Как мы перешли на Opus и стали платить меньше

Несколько Клодов над одним проектом: locks, handoffs и email 1982 года

Kimi выпустили открытую модель K2.6 для долгих задач по программированию

Что такое Harness? Полный разбор на примере Claude Code, OpenAI и LangChain

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

multi-agent.