Claude теперь «видит сны»: Anthropic выкатила режим dreaming для ИИ-агентов

Anthropic запустила dreaming в Claude Managed Agents ^[1] (инфраструктура для запуска агентов в облаке) — фоновую процедуру, в которой агент в простое перебирает свои прошлые разговоры и переписывает свою память ^[2]. Каждая сессия агента оставляет журнал событий и записи в его памяти. Когда сессий накапливается много, между ними по расписанию запускается dreaming: процедура читает эти записи, ищет повторяющиеся закономерности и обновляет память — стирает неактуальное, добавляет работающие приемы, складывает разрозненные факты в более общие правила. Можно настроить полностью автоматическое обновление, а можно — с ручным подтверждением каждого изменения. Доступ к функции пока выдают по заявке, она в режиме раннего превью.

Метафора со сном ^[3] тут не пустая. У человека во сне ^[4] память тоже консолидируется: мозг ^[5] прогоняет дневной опыт ^[6], оставляет нужное и выкидывает шум. До сих пор у ИИ-агентов такого режима не было — все знания закладывались на этапе обучения ^[7] модели. Anthropic утверждает, что dreaming видит то, что один агент сам не заметит: повторяющиеся ошибки ^[8], привычки команды, типовые ходы, к которым разные агенты приходят независимо.

В юридической компании Harvey агенты с dreaming, например, запоминают обходные пути для нестандартных файлов и поведение ^[9] конкретных инструментов — отсюда и шестикратный рост по доле успешных задач. У писательского ИИ-сервиса Spiral от издания Every устройство еще интереснее: один ведущий агент на модели Haiku принимает запрос пользователя и задает уточняющие вопросы, а затем поручает написание текста помощникам на Opus, которые работают параллельно. Каждый черновик сверяется с заранее заданными редакционными принципами — для этого используется вторая новая функция, outcomes.

Outcomes работают так: разработчик описывает критерии хорошего результата, агент пишет ответ, а отдельный проверяющий агент в собственном окне читает этот ответ и сравнивает с критериями — без доступа к ходу мысли первого агента, чтобы оценка не зависела от его рассуждений. Если что-то не сходится, проверяющий говорит, что переделать. По внутренним замерам Anthropic, такая связка дает до 10 процентных пунктов прироста к доле успешно выполненных задач в самых тяжелых случаях, плюс 8,4% на генерации файлов Word и 10,1% — на презентациях.

Anthropic постепенно забирает себе всю обвязку, которую раньше команды городили сами — память, оценка качества, разделение работы между несколькими агентами. Dreaming — самая необычная часть пакета: впервые в рабочей инфраструктуре есть механизм, в котором агенты учатся между сессиями, без переобучения самой модели. Outcomes и координация группы агентов уже доступны всем разработчикам в Claude Console, для dreaming — нужна заявка.

P.S. Поддержать меня можно подпиской на канал “сбежавшая нейросеть ^[10]“, где я рассказываю про ИИ с творческой стороны.

Автор: runaway_llm

Источник ^[11]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/29922

URLs in this post:

[1] dreaming в Claude Managed Agents: https://claude.com/blog/new-in-claude-managed-agents

[2] память: http://www.braintools.ru/article/4140

[3] сном: http://www.braintools.ru/article/9809

[4] сне: http://www.braintools.ru/article/9150

[5] мозг: http://www.braintools.ru/parts-of-the-brain

[6] опыт: http://www.braintools.ru/article/6952

[7] обучения: http://www.braintools.ru/article/5125

[8] ошибки: http://www.braintools.ru/article/4192

[9] поведение: http://www.braintools.ru/article/9372

[10] сбежавшая нейросеть: https://t.me/ai_exee

[11] Источник: https://habr.com/ru/news/1032266/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1032266

Нажмите здесь для печати.