- BrainTools - https://www.braintools.ru -

Новый алгоритм Sakana AI позволяет большим языковым моделям работать сообща для решения сложных задач

Японский стартап в области искусственного интеллекта [1] Sakana AI разработал новый метод, который позволяет нескольким большим языковым моделям, таким как ChatGPT и Gemini, совместно решать одну и ту же задачу. Предварительные тесты показывают, что такой совместный подход превосходит работу отдельных моделей.

Новый алгоритм Sakana AI позволяет большим языковым моделям работать сообща для решения сложных задач - 1

Метод под названием AB-MCTS (адаптивный поиск по дереву Монте-Карло с ветвлением) представляет собой алгоритм, который позволяет нескольким моделям ИИ решать задачу одновременно. Модели обмениваются данными и уточняют свои предложения, работая сообща, как команда людей.

AB-MCTS сочетает в себе две разные стратегии поиска: он может либо совершенствовать существующее решение (поиск в глубину), либо пробовать совершенно новые подходы (поиск в ширину). Вероятностная модель постоянно определяет, в каком направлении двигаться дальше.

В версии с несколькими языковыми моделями (Multi LLM AB-MCTS) система динамически выбирает, какая модель — например, ChatGPT, Gemini или DeepSeek — лучше всего подходит для решения текущей задачи. Этот выбор меняется в зависимости от того, какая модель даёт наилучшие результаты при решении конкретной проблемы.

Комбинации нескольких LLM заметно повышают производительность AB-MCTS Pass@k на ARC-AGI-2 по мере увеличения количества вызовов LLM, при этом o4-mini + Gemini-2.5-Pro + R1-0528 превосходят одиночные модели

Комбинации нескольких LLM заметно повышают производительность AB-MCTS Pass@k на ARC-AGI-2 по мере увеличения количества вызовов LLM, при этом o4-mini + Gemini-2.5-Pro + R1-0528 превосходят одиночные модели

AB-MCTS получает результаты от ARC-AGI-2

Во время тестирования на сложном бенчмарке ARC-AGI-2 модель Multi-LLM AB-MCTS решила больше задач, чем любая другая модель, работающая отдельно (Single-LLM AB-MCTS). 

Всё же есть некоторые ограничения. Если разрешить моделям неограниченное количество попыток, система будет находить правильный ответ примерно в 30% случаев. Но в официальном тесте ARC-AGI-2, где обычно можно дать только один или два ответа, процент успешных попыток значительно снижается.

Чтобы решить эту проблему, Sakana AI планирует разработать новые методы автоматического определения и выбора наиболее подходящих вариантов. Одна из идей заключается в использовании дополнительной модели ИИ для оценки вариантов. Этот подход также можно сочетать с системами, в которых модели ИИ обсуждают решения друг с другом.

Компания Sakana AI выпустила алгоритм в виде программного обеспечения с открытым исходным кодом под названием TreeQuest, чтобы другие разработчики могли применять этот метод для решения своих задач.


Делегируйте часть рутинных задач вместе с BotHub [2]! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке [3] вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Перевод, источник новости здесь [4].

Автор: mefdayy

Источник [5]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/17076

URLs in this post:

[1] интеллекта: http://www.braintools.ru/article/7605

[2] BotHub: https://bothub.chat/?utm_source=contentmarketing&utm_medium=habr&utm_campaign=news&utm_content=THE_NEW_SAKANA_AI_ALGORITHM_ENABLES_LARGE_LANGUAGE_MODELS_TO_WORK_TOGETHER_TO_SOLVE_COMPLEX_PROBLEMS

[3] По ссылке: https://bothub.chat/?invitedBy=m_aGCkuyTgqllHCK0dUc7

[4] здесь: https://the-decoder.com/sakana-ais-new-algorithm-lets-large-language-models-work-together-to-solve-complex-problems/

[5] Источник: https://habr.com/ru/companies/bothub/news/926034/?utm_source=habrahabr&utm_medium=rss&utm_campaign=926034

www.BrainTools.ru

Rambler's Top100