- BrainTools - https://www.braintools.ru -

Alibaba сделала громкий шаг в гонке искусственного интеллекта [1], представив Qwen3-Next-80B-A3B [2] — модель, которая сочетает мощность в 80 миллиардов параметров с революционной эффективностью. В отличие от традиционных гигантов, новая архитектура активирует лишь около 3 миллиардов параметров на каждый токен, что делает обучение [3] и инференс в десять раз дешевле и быстрее, чем у прошлой Qwen3-32B. Особенно впечатляюще модель проявляет себя при работе с текстами сверхдлинного формата — от 32 тысяч токенов и выше.
В основе Qwen3-Next-80B-A3B лежит гибридная архитектура Gated DeltaNet + Gated Attention, которая объединяет точность и скорость. Дополняет её ультраразреженная схема Mixture-of-Experts: 512 экспертов, из которых одновременно задействуется лишь десять и один общий. Такой подход позволяет распределять вычислительные ресурсы максимально рационально, включаются только те модули, которые нужны здесь и сейчас.
Модель также поддерживает Multi-Token Prediction, то есть умеет предсказывать сразу несколько слов вперёд и быстро их проверять. Это обеспечивает более высокую скорость генерации текста без потери качества. В тестах Qwen3-Next-80B-A3B уверенно обходит Qwen3-32B, а в задачах рассуждений и анализа длинного контекста приближается к результатам флагмана Qwen3-235B, который стоит на порядок дороже в эксплуатации.
Особенно выделяются специализированные версии. Qwen3-Next-80B-A3B-Instruct почти достигла уровня качества 235B-модели, а Qwen3-Next-80B-A3B-Thinking сумела превзойти даже Google Gemini-2.5-Flash-Thinking в задачах рассуждений. Это делает новинку одним из самых интересных релизов 2025 года в области больших языковых моделей.
Qwen3-Next-80B-A3B уже доступна на платформах Qwen Chat, HuggingFace [4], ModelScope [5], Kaggle [6]и в облаке Alibaba Cloud [7].
Делегируйте часть рутинных задач вместе с BotHub! [8] Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке [9] вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Подробнее [10]
Автор: cognitronn
Источник [11]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/19451
URLs in this post:
[1] интеллекта: http://www.braintools.ru/article/7605
[2] Qwen3-Next-80B-A3B: https://chat.qwen.ai/
[3] обучение: http://www.braintools.ru/article/5125
[4] HuggingFace: https://huggingface.co/collections/Qwen/qwen3-next-68c25fd6838e585db8eeea9d?spm=a2ty_o06.30285417.0.0.4766c9217J9r32
[5] ModelScope: https://modelscope.cn/collections/Qwen3-Next-c314f23bd0264a?spm=a2ty_o06.30285417.0.0.4766c9217J9r32
[6] Kaggle : https://www.kaggle.com/models/qwen-lm/qwen3-next-80b
[7] Alibaba Cloud: https://www.alibabacloud.com/help/en/model-studio/models#c5414da58bjgj
[8] BotHub!: https://bothub.chat/?utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_source=contentmarketing&utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_medium=habr&utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_campaign=news&utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_content=ALIBABA%20UNVEILS%20QWEN3-NEXT-80B:%20MORE%20POWERFUL,%20FASTER,%20AND%20CHEAPER
[9] По ссылке: https://bothub.chat/?invitedBy=m_aGCkuyTgqllHCK0dUc7
[10] Подробнее: https://qwen.ai/blog?id=4074cca80393150c248e508aa62983f9cb7d27cd&from=research.latest-advancements-list
[11] Источник: https://habr.com/ru/companies/bothub/news/946470/?utm_source=habrahabr&utm_medium=rss&utm_campaign=946470
Нажмите здесь для печати.