harness engineering.

Harness кодинг‑агента: разобрал исходники Codex, OpenCode, Pi и свою собственную

В прошлой статье про промпт-кэш я сформулировал вещь, которая на самом деле важнее самого кэша: модель ничего не помнит, она stateless

продолжить чтение

Оставлено в

Создание харнесса для код-агентов под enterprise-фреймворк на Java

Строим мосты между агентами и технологиямиВайб-кодинг, или AI-assisted development, отлично работает на уровне прототипа: агент получает текстовое ТЗ и быстро собирает первый рабочий вариант. Но в корпоративной разработке этого мало.

продолжить чтение

Оставлено в

12 факторов хорошего агента

Почти все мы только учимся работать с агентами. Даже опытные команды иногда управляют агентами так, что те приносят больше вреда, чем пользы. HumanLayer сформулировал 12 принципов того, как делать и настраивать агентов правильно. Каждый пункт отвечает на вопрос, что работает хорошо, а что стабильно приводит к проблемам.1. Структурированный выводДо появления структурированного вывода от языковой модели нельзя было ожидать детерминированного результата: она возвращала произвольный текст. Подключить ее к реальной системе было крайне сложно.

продолжить чтение

Оставлено в

Галлюцинации недели: SpaceX покупает Cursor за $60 млрд, GLM-5.2 догоняет Opus, а Midjourney просвечивает людей звуком

продолжить чтение

Оставлено в

Промпты, RAG, LLM-тюнинг, Harness… Идём дальше?

В LLM-инженерии постепенно меняется объект оптимизации.Сначала подбирали промпты. Потом настраивали RAG. Параллельно тюнили модели под конкретные задачи и домены, подбирали грамматики, засовывали модель в цикл.

продолжить чтение

Оставлено в

Как оценивать ИИ‑агентов в проде: нижняя планка, трассы и кодовые проверки

продолжить чтение

Оставлено в

Как кодинг-агенты используют инструменты, память и контекст репозитория, чтобы писать код лучше

Это перевод хорошей статьи про базу того, как устроены кодинг-ассистенты и что для них важно: что такое харнесс и харнесс-инжиниринг, в чем разница просто агентной обвязки и кодинговой, что такое компактизация и почему та же самая модель в консольке ощущается мощнее, чем просто в веб-чате. Сильного хардкора и больших откровений в ней нет, но это отличный материал для старта изучения архитектуры кодинг-ассистентов и лучшего понимания, как оно работает внутри.В этой статье я хочу разобрать общую архитектуру кодинг-агентов и агентных харнессов

продолжить чтение

Оставлено в

Как меняется delivery, когда в команде появляются агенты

Когда LLM-интерфейсы и coding agents становятся рабочим инструментом команды, менять приходится не только инструменты, но и сам процесс поставки изменений.Команды обычно приходят к формализованному процессу поставки не из любви к процессам, а тогда, когда нужно получать предсказуемые сроки, управляемый риск и воспроизводимый результат. В серии статей на примере RuStore

продолжить чтение

Оставлено в

Галлюцинации недели: Gemini 3.1 Pro, Sonnet 4.6 в бою и новый дом llama.cpp

Google бросает перчатку, Anthropic сканирует чужой код, а моделям выдают фудтраки и деньги на бизнес. Приглядимся ко всему по порядку.Google выпустил Gemini 3.1 Pro. Как обычно, мы видим красивые бенчмарки: ARC-AGI-2 вырос с 31% до 77%, SWE-Bench Verified 80,6%. По соотношению цены и заявленного качества модель очень интересная, а ещё она умеет такое.В реальной работе не всё гладко. Бывший сотрудник Google на

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

harness engineering.

Harness кодинг‑агента: разобрал исходники Codex, OpenCode, Pi и свою собственную

Создание харнесса для код-агентов под enterprise-фреймворк на Java

12 факторов хорошего агента

Галлюцинации недели: SpaceX покупает Cursor за $60 млрд, GLM-5.2 догоняет Opus, а Midjourney просвечивает людей звуком

Промпты, RAG, LLM-тюнинг, Harness… Идём дальше?

Как оценивать ИИ‑агентов в проде: нижняя планка, трассы и кодовые проверки

Как кодинг-агенты используют инструменты, память и контекст репозитория, чтобы писать код лучше

Как меняется delivery, когда в команде появляются агенты

Галлюцинации недели: Gemini 3.1 Pro, Sonnet 4.6 в бою и новый дом llama.cpp

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

harness engineering.