
Alibaba представила новый фреймворк AgentEvolver, который позволяет агентам на базе больших языковых моделей учиться самостоятельно. Вместо того чтобы ждать разметки данных от человека, агент сам придумывает задачи, выполняет их и оценивает свои действия, как настоящий ученик. Так ИИ становится эффективнее и быстрее осваивает новые инструменты.

AgentEvolver работает по трём основным принципам. Сначала агент ищет, что можно попробовать в среде, и придумывает задачи. Затем он переиспользует прошлый опыт, запоминая, что сработало, а что нет. После выполнения задания агент анализирует каждый шаг, чтобы понять, какие действия были полезны и как можно улучшить результат в следующий раз.

Тесты показали, что AgentEvolver действительно работает. Для моделей с 7 миллиардов параметров эффективность в многошаговых задачах с использованием внешних инструментов выросла на 29–30 процентов по сравнению с обычным методом обучения с подкреплением. Для моделей с 14 миллиардов параметров рост составил примерно 28 процентов. При этом агенту требуется меньше данных для обучения и меньшая подготовка среды.

Такой подход открывает новые возможности. Теперь компании могут использовать ИИ-агентов, которые сами учатся и адаптируются под конкретные задачи, будь то работа с API, автоматизация процессов или аналитика данных. Это снижает расходы на подготовку данных и делает внедрение ИИ проще и быстрее.

В будущем AgentEvolver может стать основой для универсальных ИИ-агентов, которые можно загрузить в любую среду и они быстро научатся выполнять нужные задачи без дополнительной разметки и настройки.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Автор: cognitronn


