DeepSeekMath-V2: ИИ-модель получила уровень золотой медали на математической олимпиаде

DeepSeek заявил, что его новая модель DeepSeekMath-V2 ^[1] продемонстрировала результат уровня золотой медали на Международной математической олимпиаде (IMO), что, по мнению компании, позволяет ей составить серьезную конкуренцию ведущим западным лабораториям в области искусственного интеллекта ^[2].

Согласно данным стартапа, модель показала результаты, соответствующие золотым медалям на Международной математической олимпиаде (IMO) 2025 года и Китайской математической олимпиаде (CMO) 2024 года. Кроме того, в конкурсе Патнэма ИИ набрал 118 баллов из 120 возможных.

DeepSeekMath-V2: ИИ-модель получила уровень золотой медали на математической олимпиаде - 2

В технической документации ^[3] DeepSeek объясняет, что предыдущие ИИ-модели часто выдавали правильные ответы, не демонстрируя верных промежуточных решений. Для решения этой проблемы в DeepSeekMath-V2 реализован многоэтапный процесс проверки: верификатор оценивает корректность доказательства, а метаверификатор анализирует обоснованность самой проверки. Этот подход позволяет системе самостоятельно проверять и улучшать свои решения в реальном времени.

Важно отметить, что в статье не упоминается использование внешних инструментов вроде калькуляторов или интерпретаторов кода. Архитектура модели предполагает, что все тесты проводятся исключительно с использованием естественного языка. В экспериментах одна и та же модель DeepSeekMath-V2 генерирует доказательства и проверяет их. Эффективность достигается за счет способности ИИ анализировать и совершенствовать собственные решения без привлечения внешнего математического программного обеспечения.

Для решения особо сложных задач система масштабирует вычисления во время тестирования, параллельно выбирая и проверяя множество возможных доказательств, чтобы с высокой вероятностью получить верный ответ. Технически модель основана на архитектуре DeepSeek-V3.2-Exp-Base ^[4].

DeepseekMath-V2 полностью решила пять из шести задач IMO 2025 и четыре задачи CMO 2024. На конкурсе Putnam 2024 модель полностью решила одиннадцать задач и получила частичное решение ещё одной

Делегируйте часть рутинных задач вместе с BotHub ^[5]! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке ^[6] вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Источник ^[7]

Автор: MrRjxrby

Источник ^[8]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/22564

URLs in this post:

[1] новая модель DeepSeekMath-V2: https://huggingface.co/deepseek-ai/DeepSeek-Math-V2

[2] интеллекта: http://www.braintools.ru/article/7605

[3] технической документации: https://github.com/deepseek-ai/DeepSeek-Math-V2/blob/main/DeepSeekMath_V2.pdf

[4] DeepSeek-V3.2-Exp-Base: https://the-decoder.com/deepseek-slashes-api-prices-by-up-to-75-percent-with-its-latest-v3-2-model/

[5] BotHub: https://bothub.chat/?utm_source=contentmarketing&utm_medium=habr&utm_campaign=news&utm_content=THE_AI_MODEL_RECIEVED_THE_GOLD_MEDAL_LEVEL_AT_THE_MATHEMATICAL_OLYMPIAD

[6] По ссылке: https://bothub.chat/?invitedBy=m_aGCkuyTgqllHCK0dUc7

[7] Источник: https://the-decoder.com/deepseekmath-v2-is-deepseeks-latest-attempt-to-pop-the-us-ai-bubble/

[8] Источник: https://habr.com/ru/companies/bothub/news/971608/?utm_source=habrahabr&utm_medium=rss&utm_campaign=971608

Нажмите здесь для печати.