- BrainTools - https://www.braintools.ru -
ASI-ARCH [1] – экспериментальная демонстрация [2] искусственного сверхинтеллекта для исследований в области ИИ, который способен полностью автономно вести научную работу по поиску новых нейросетевых архитектур.

Система самостоятельно выдвигает гипотезы, реализует их в виде исполняемого кода, обучает и проверяет на практике. Результатом этой работы стали 1773 автономных эксперимента, которые заняли свыше 20 000 GPU-часов и привели к открытию 106 новых SOTA-архитектур с линейным механизмом внимания [3].
На первом этапе система работает с небольшими моделями размером около 20 млн параметров, обучая их на 1 млрд токенов. На этом этапе было проведено 1773 эксперимента, которые заняли примерно 10 000 GPU-часов. Всего на этом этапе было отобрано 1350 перспективных кандидатов — все они превзошли базовую архитектуру DeltaNet как по лоссу, так и по метрикам на бенчмарках.
Второй этап — верификация. Кандидаты первого этапа были масштабированы до 340 млн параметров, чтобы соответствовать конфигурации DeltaNet. После фильтрации архитектур с избыточной сложностью или числом параметров осталось около 400 моделей. Их обучение [4] на 1 млрд. токенов потребовало ещё 10 000 GPU-часов. В итоге именно из этой группы были выделены 106 архитектур, достигших SOTA-уровня.

Для финальной валидации исследователи отобрали 5 лучших моделей, обучили их на 15 млрд токенов и сравнили с Mamba2, Gated DeltaNet и DeltaNet.
ASI-ARCH явно предпочитает работать с проверенными временем компонентами: гейтингом и свёрткой. Но самое главное — распределение компонентов в 106 лучших моделях имеет значительно менее выраженный long-tail distribution по сравнению с остальными 1667 сгенерированными архитектурами.
Это означает, что система добивается успеха не путем хаотичного перебора экзотических идей, а через итеративное улучшение набора проверенных техник. По сути, это очень напоминает методологию работы ученых-людей.
Одна из лучших найденных ИИ-архитектур, PathGateFusionNet, показала средний результат по всем бенчмаркам 48.51. Для сравнения, Mamba2 набрала 47.84, а разработанная человеком Gated DeltaNet — 47.32. Другая генерация, ContentSharpRouter, достигла показателя 48.34.
Если посмотреть на отдельные тесты, то PathGateFusionNet получила на BoolQ 60.58 балла, а Gated DeltaNet — 60.12. AdaptiveEntropyRouter в версии на 340 млн. параметров показала результат на тестах 44.31, что на 2.21 пункта выше, чем у Gated DeltaNet (42.10).
И так практически во всем, улучшения наблюдаются по всему спектру задач.
Cognition — знания, извлеченные из научной литературы;
Analysis — выводы, сделанные на основе собственных прошлых экспериментов;
Originality — абсолютно новые идеи.
Для всех 1773 сгенерированных архитектур распределение источников было таким:
51,7% идей приходило из человеческой литературы;
38,2% — из собственного анализа; 10,1% были оригинальными.

Но если посмотреть только на 106 SOTA-итогов, картина меняется. Доля идей, основанных на Analysis, возрастает с 38,2% до 44,8%, а доля Cognition немного снижается до 48,6%.
Таким образом, чтобы достичь ощутимых результатов, ИИ недостаточно просто копировать и комбинировать человеческие наработки. Он должен анализировать собственный опыт [5], учиться на своих же удачах и провалах, синтезируя более совершенные решения.
Страница проекта [2]
[6]Arxiv [1]
[7]GitHub [8]
Делегируйте часть рутинных задач вместе с BotHub [9]! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке [10] вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Автор: mefdayy
Источник [11]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/17716
URLs in this post:
[1] ASI-ARCH: https://arxiv.org/pdf/2507.18074
[2] демонстрация: https://gair-nlp.github.io/ASI-Arch/
[3] внимания: http://www.braintools.ru/article/7595
[4] обучение: http://www.braintools.ru/article/5125
[5] опыт: http://www.braintools.ru/article/6952
[6]
: https://gair-nlp.github.io/ASI-Arch/)%EF%BF%BC
[7]
: https://arxiv.org/pdf/2507.18074)%EF%BF%BC
[8] GitHub: https://github.com/GAIR-NLP/ASI-Arch
[9] BotHub: https://bothub.chat/?utm_source=contentmarketing&utm_medium=habr&utm_campaign=news&utm_content=AI_THAT_CREATES_AI_ITSELF:_ASI-ARCH_FOUND_106_NEW_SOTA-ARCHITECTURES
[10] По ссылке: https://bothub.chat/?invitedBy=m_aGCkuyTgqllHCK0dUc7
[11] Источник: https://habr.com/ru/companies/bothub/news/931582/?utm_source=habrahabr&utm_medium=rss&utm_campaign=931582
Нажмите здесь для печати.