- BrainTools - https://www.braintools.ru -
Американский стартап Inception представил [1] Mercury 2 — первую языковую модель, использующую диффузионную архитектуру вместо традиционной авторегрессии, что позволяет ей генерировать текст в пять раз быстрее существующих аналогов.

Вместо последовательного предсказания токенов модель создает черновой ответ целиком и итеративно его улучшает — аналогичным способом работают генераторы видео и картинок. В результате Mercury 2 достигает скорости свыше 1000 токенов в секунду, при этом качество сопоставимо с Claude 4.5 Haiku и GPT-5.2 Mini.
Сегодня почти все языковые модели, включая решения от OpenAI, Anthropic и Google DeepMind, работают на основе авторегрессивной архитектуры — они генерируют текст последовательно, токен за токеном. Такой подход ограничивает скорость: чем глубже рассуждение, тем выше задержка и затраты.
В ответ на это индустрия инвестировала миллиарды долларов в чипы-ускорители, оптимизацию инфраструктуры и сжатие моделей, однако сам принцип последовательной генерации оставался неизменным.
Mercury 2 предлагает альтернативу — архитектуру, основанную на диффузии. Вместо пошагового предсказания следующего токена модель формирует черновой вариант ответа целиком, а затем итеративно уточняет его, обрабатывая множество токенов параллельно. Такой подход, ранее применявшийся преимущественно в генерации изображений и видео, позволяет радикально повысить пропускную способность без необходимости полагаться исключительно на аппаратную оптимизацию.
По данным компании, Mercury 2 достигает скорости свыше 1000 токенов в секунду на графических процессорах NVIDIA Blackwell и при этом демонстрирует качество, сопоставимое с Claude 4.5 Haiku и GPT-5.2 Mini. Модель поддерживает контекстное окно объёмом до 128 000 токенов.
В стандартных бенчмарках она получила 91,1 балла на AIME 2025 и конкурентные результаты в задачах по программированию, научных вычислениях и логическом анализе. Стоимость вывода заявлена на уровне $0,25 за миллион входных токенов и $0,75 за миллион выходных.
Ключевое преимущество подхода — не только скорость, но и устойчивость вывода. Благодаря итеративному уточнению модель способна корректировать ошибки [2] в процессе генерации, формировать структурированные ответы в формате JSON и более предсказуемо работать в агентных системах. Это особенно важно для многошаговых рабочих процессов, где задержка на каждом этапе накапливается и влияет на итоговый пользовательский опыт [3].
В компании подчеркивают, что Mercury 2 уже ориентирована на промышленное применение: от интерактивного программирования и голосовых интерфейсов до RAG-конвейеров и корпоративной автоматизации.
Модель совместима с API OpenAI, что позволяет интегрировать её в существующие стеки без серьезной переработки инфраструктуры. Среди первых партнеров и инвесторов проекта — Menlo Ventures, Mayfield, M12 и ряд технологических фондов, а поддержку в инфраструктуре обеспечивает NVIDIA.
Mercury 2 уже доступна через API компании, и Inception активно привлекает партнеров для масштабного внедрения. Если заявленные показатели подтвердятся на практике, диффузионная архитектура может стать новым этапом эволюции языковых моделей — не за счет наращивания вычислительной мощности, а благодаря смене самого принципа генерации.
Делегируйте часть рутинных задач вместе с BotHub [4]! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке [5] вы можете получить 300 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Попробовать [6]
Автор: mefdayy
Источник [7]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/26268
URLs in this post:
[1] представил: https://www.inceptionlabs.ai/blog/introducing-mercury-2
[2] ошибки: http://www.braintools.ru/article/4192
[3] опыт: http://www.braintools.ru/article/6952
[4] BotHub: https://bothub.chat/?utm%5C_source=contentmarketing&utm%5C_medium=habr&utm%5C_campaign=news&utm%5C_content%20=INCEPTION_LABS_PRESENTS_THE_DIFFUSION_LANGUAGE_MODEL_MERCURY_2
[5] По ссылке: https://bothub.chat/?invitedBy=iTNi-351UcHgc1BxGFWim
[6] Попробовать: https://chat.inceptionlabs.ai/
[7] Источник: https://habr.com/ru/companies/bothub/news/1004078/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1004078
Нажмите здесь для печати.