Alibaba представила Qwen3-Next-80B: мощнее, быстрее и дешевле. ai.. ai. chatgpt.. ai. chatgpt. Claude.. ai. chatgpt. Claude. gemini.. ai. chatgpt. Claude. gemini. qwen.. ai. chatgpt. Claude. gemini. qwen. Блог компании BotHub.. ai. chatgpt. Claude. gemini. qwen. Блог компании BotHub. Будущее здесь.. ai. chatgpt. Claude. gemini. qwen. Блог компании BotHub. Будущее здесь. ИИ.. ai. chatgpt. Claude. gemini. qwen. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект.. ai. chatgpt. Claude. gemini. qwen. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. Машинное обучение.. ai. chatgpt. Claude. gemini. qwen. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. Машинное обучение. машинное+обучение.. ai. chatgpt. Claude. gemini. qwen. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. Машинное обучение. машинное+обучение. научно-популярное.. ai. chatgpt. Claude. gemini. qwen. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. Машинное обучение. машинное+обучение. научно-популярное. нейросети.
Alibaba представила Qwen3-Next-80B: мощнее, быстрее и дешевле - 1

Alibaba сделала громкий шаг в гонке искусственного интеллекта, представив Qwen3-Next-80B-A3B — модель, которая сочетает мощность в 80 миллиардов параметров с революционной эффективностью. В отличие от традиционных гигантов, новая архитектура активирует лишь около 3 миллиардов параметров на каждый токен, что делает обучение и инференс в десять раз дешевле и быстрее, чем у прошлой Qwen3-32B. Особенно впечатляюще модель проявляет себя при работе с текстами сверхдлинного формата — от 32 тысяч токенов и выше.

В основе Qwen3-Next-80B-A3B лежит гибридная архитектура Gated DeltaNet + Gated Attention, которая объединяет точность и скорость. Дополняет её ультраразреженная схема Mixture-of-Experts: 512 экспертов, из которых одновременно задействуется лишь десять и один общий. Такой подход позволяет распределять вычислительные ресурсы максимально рационально, включаются только те модули, которые нужны здесь и сейчас.

Модель также поддерживает Multi-Token Prediction, то есть умеет предсказывать сразу несколько слов вперёд и быстро их проверять. Это обеспечивает более высокую скорость генерации текста без потери качества. В тестах Qwen3-Next-80B-A3B уверенно обходит Qwen3-32B, а в задачах рассуждений и анализа длинного контекста приближается к результатам флагмана Qwen3-235B, который стоит на порядок дороже в эксплуатации.

Особенно выделяются специализированные версии. Qwen3-Next-80B-A3B-Instruct почти достигла уровня качества 235B-модели, а Qwen3-Next-80B-A3B-Thinking сумела превзойти даже Google Gemini-2.5-Flash-Thinking в задачах рассуждений. Это делает новинку одним из самых интересных релизов 2025 года в области больших языковых моделей.

Qwen3-Next-80B-A3B уже доступна на платформах Qwen Chat, HuggingFace, ModelScope, Kaggle и в облаке Alibaba Cloud.


Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Подробнее

Автор: cognitronn

Источник

Rambler's Top100