Новый алгоритм Sakana AI позволяет большим языковым моделям работать сообща для решения сложных задач. AB-MCTS.. AB-MCTS. chatgpt.. AB-MCTS. chatgpt. gemini.. AB-MCTS. chatgpt. gemini. llm.. AB-MCTS. chatgpt. gemini. llm. sakana ai.. AB-MCTS. chatgpt. gemini. llm. sakana ai. Блог компании BotHub.. AB-MCTS. chatgpt. gemini. llm. sakana ai. Блог компании BotHub. ИИ.. AB-MCTS. chatgpt. gemini. llm. sakana ai. Блог компании BotHub. ИИ. ии и машинное обучение.. AB-MCTS. chatgpt. gemini. llm. sakana ai. Блог компании BotHub. ИИ. ии и машинное обучение. искусственный интеллект.. AB-MCTS. chatgpt. gemini. llm. sakana ai. Блог компании BotHub. ИИ. ии и машинное обучение. искусственный интеллект. Машинное обучение.. AB-MCTS. chatgpt. gemini. llm. sakana ai. Блог компании BotHub. ИИ. ии и машинное обучение. искусственный интеллект. Машинное обучение. совместный подход.. AB-MCTS. chatgpt. gemini. llm. sakana ai. Блог компании BotHub. ИИ. ии и машинное обучение. искусственный интеллект. Машинное обучение. совместный подход. стартапы.. AB-MCTS. chatgpt. gemini. llm. sakana ai. Блог компании BotHub. ИИ. ии и машинное обучение. искусственный интеллект. Машинное обучение. совместный подход. стартапы. чат-боты.

Японский стартап в области искусственного интеллекта Sakana AI разработал новый метод, который позволяет нескольким большим языковым моделям, таким как ChatGPT и Gemini, совместно решать одну и ту же задачу. Предварительные тесты показывают, что такой совместный подход превосходит работу отдельных моделей.

Новый алгоритм Sakana AI позволяет большим языковым моделям работать сообща для решения сложных задач - 1

Метод под названием AB-MCTS (адаптивный поиск по дереву Монте-Карло с ветвлением) представляет собой алгоритм, который позволяет нескольким моделям ИИ решать задачу одновременно. Модели обмениваются данными и уточняют свои предложения, работая сообща, как команда людей.

AB-MCTS сочетает в себе две разные стратегии поиска: он может либо совершенствовать существующее решение (поиск в глубину), либо пробовать совершенно новые подходы (поиск в ширину). Вероятностная модель постоянно определяет, в каком направлении двигаться дальше.

В версии с несколькими языковыми моделями (Multi LLM AB-MCTS) система динамически выбирает, какая модель — например, ChatGPT, Gemini или DeepSeek — лучше всего подходит для решения текущей задачи. Этот выбор меняется в зависимости от того, какая модель даёт наилучшие результаты при решении конкретной проблемы.

Комбинации нескольких LLM заметно повышают производительность AB-MCTS Pass@k на ARC-AGI-2 по мере увеличения количества вызовов LLM, при этом o4-mini + Gemini-2.5-Pro + R1-0528 превосходят одиночные модели

Комбинации нескольких LLM заметно повышают производительность AB-MCTS Pass@k на ARC-AGI-2 по мере увеличения количества вызовов LLM, при этом o4-mini + Gemini-2.5-Pro + R1-0528 превосходят одиночные модели

AB-MCTS получает результаты от ARC-AGI-2

Во время тестирования на сложном бенчмарке ARC-AGI-2 модель Multi-LLM AB-MCTS решила больше задач, чем любая другая модель, работающая отдельно (Single-LLM AB-MCTS). 

Всё же есть некоторые ограничения. Если разрешить моделям неограниченное количество попыток, система будет находить правильный ответ примерно в 30% случаев. Но в официальном тесте ARC-AGI-2, где обычно можно дать только один или два ответа, процент успешных попыток значительно снижается.

Чтобы решить эту проблему, Sakana AI планирует разработать новые методы автоматического определения и выбора наиболее подходящих вариантов. Одна из идей заключается в использовании дополнительной модели ИИ для оценки вариантов. Этот подход также можно сочетать с системами, в которых модели ИИ обсуждают решения друг с другом.

Компания Sakana AI выпустила алгоритм в виде программного обеспечения с открытым исходным кодом под названием TreeQuest, чтобы другие разработчики могли применять этот метод для решения своих задач.


Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Перевод, источник новости здесь.

Автор: mefdayy

Источник

Rambler's Top100