- BrainTools - https://www.braintools.ru -

ИИ, который сам создает ИИ: ASI-ARCH нашел 106 новых SOTA-архитектур

ASI-ARCH [1] – экспериментальная демонстрация [2] искусственного сверхинтеллекта для исследований в области ИИ, который способен полностью автономно вести научную работу по поиску новых нейросетевых архитектур.

ИИ, который сам создает ИИ: ASI-ARCH нашел 106 новых SOTA-архитектур - 1

Система самостоятельно выдвигает гипотезы, реализует их в виде исполняемого кода, обучает и проверяет на практике. Результатом этой работы стали 1773 автономных эксперимента, которые заняли свыше 20 000 GPU-часов и привели к открытию 106 новых SOTA-архитектур с линейным механизмом внимания [3].

Весь процесс разделен на 2 этапа: поиск гипотез и их проверка

На первом этапе система работает с небольшими моделями размером около 20 млн параметров, обучая их на 1 млрд токенов. На этом этапе было проведено 1773 эксперимента, которые заняли примерно 10 000 GPU-часов. Всего на этом этапе было отобрано 1350 перспективных кандидатов — все они превзошли базовую архитектуру DeltaNet как по лоссу, так и по метрикам на бенчмарках.

Второй этап — верификация. Кандидаты первого этапа были масштабированы до 340 млн параметров, чтобы соответствовать конфигурации DeltaNet. После фильтрации архитектур с избыточной сложностью или числом параметров осталось около 400 моделей. Их обучение [4] на 1 млрд. токенов потребовало ещё 10 000 GPU-часов. В итоге именно из этой группы были выделены 106 архитектур, достигших SOTA-уровня.

ИИ, который сам создает ИИ: ASI-ARCH нашел 106 новых SOTA-архитектур - 2

Для финальной валидации исследователи отобрали 5 лучших моделей, обучили их на 15 млрд токенов и сравнили с Mamba2, Gated DeltaNet и DeltaNet.

Анализ предпочтений системы показал интересные закономерности

ASI-ARCH явно предпочитает работать с проверенными временем компонентами: гейтингом и свёрткой. Но самое главное — распределение компонентов в 106 лучших моделях имеет значительно менее выраженный long-tail distribution по сравнению с остальными 1667 сгенерированными архитектурами.

Это означает, что система добивается успеха не путем хаотичного перебора экзотических идей, а через итеративное улучшение набора проверенных техник. По сути, это очень напоминает методологию работы ученых-людей.

Результаты

Одна из лучших найденных ИИ-архитектур, PathGateFusionNet, показала средний результат по всем бенчмаркам 48.51. Для сравнения, Mamba2 набрала 47.84, а разработанная человеком Gated DeltaNet — 47.32. Другая генерация, ContentSharpRouter, достигла показателя 48.34.

Если посмотреть на отдельные тесты, то PathGateFusionNet получила на BoolQ 60.58 балла, а Gated DeltaNet — 60.12. AdaptiveEntropyRouter в версии на 340 млн. параметров показала результат на тестах 44.31, что на 2.21 пункта выше, чем у Gated DeltaNet (42.10).

И так практически во всем, улучшения наблюдаются по всему спектру задач.

И самое интересное — откуда система черпает идеи? Источников всего 3:

Cognition — знания, извлеченные из научной литературы;
Analysis — выводы, сделанные на основе собственных прошлых экспериментов;
Originality — абсолютно новые идеи.

Для всех 1773 сгенерированных архитектур распределение источников было таким:

51,7% идей приходило из человеческой литературы;
38,2% — из собственного анализа; 10,1% были оригинальными.

ИИ, который сам создает ИИ: ASI-ARCH нашел 106 новых SOTA-архитектур - 3

Но если посмотреть только на 106 SOTA-итогов, картина меняется. Доля идей, основанных на Analysis, возрастает с 38,2% до 44,8%, а доля Cognition немного снижается до 48,6%.

Таким образом, чтобы достичь ощутимых результатов, ИИ недостаточно просто копировать и комбинировать человеческие наработки. Он должен анализировать собственный опыт [5], учиться на своих же удачах и провалах, синтезируя более совершенные решения.

Страница проекта [2]
[6]Arxiv [1]
[7]GitHub [8]


Делегируйте часть рутинных задач вместе с BotHub [9]! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке [10] вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Автор: mefdayy

Источник [11]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/17716

URLs in this post:

[1] ASI-ARCH: https://arxiv.org/pdf/2507.18074

[2] демонстрация: https://gair-nlp.github.io/ASI-Arch/

[3] внимания: http://www.braintools.ru/article/7595

[4] обучение: http://www.braintools.ru/article/5125

[5] опыт: http://www.braintools.ru/article/6952

[6]
: https://gair-nlp.github.io/ASI-Arch/)%EF%BF%BC

[7]
: https://arxiv.org/pdf/2507.18074)%EF%BF%BC

[8] GitHub: https://github.com/GAIR-NLP/ASI-Arch

[9] BotHub: https://bothub.chat/?utm_source=contentmarketing&utm_medium=habr&utm_campaign=news&utm_content=AI_THAT_CREATES_AI_ITSELF:_ASI-ARCH_FOUND_106_NEW_SOTA-ARCHITECTURES

[10] По ссылке: https://bothub.chat/?invitedBy=m_aGCkuyTgqllHCK0dUc7

[11] Источник: https://habr.com/ru/companies/bothub/news/931582/?utm_source=habrahabr&utm_medium=rss&utm_campaign=931582

www.BrainTools.ru

Rambler's Top100