DeepSeekMath-V2: ИИ-модель получила уровень золотой медали на математической олимпиаде. ai.. ai. deepseek.. ai. deepseek. Блог компании BotHub.. ai. deepseek. Блог компании BotHub. Будущее здесь.. ai. deepseek. Блог компании BotHub. Будущее здесь. ИИ.. ai. deepseek. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект.. ai. deepseek. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. математическая олимпиада.. ai. deepseek. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. математическая олимпиада. научно-популярное.. ai. deepseek. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. математическая олимпиада. научно-популярное. нейросеть.
DeepSeekMath-V2: ИИ-модель получила уровень золотой медали на математической олимпиаде - 1

DeepSeek заявил, что его новая модель DeepSeekMath-V2 продемонстрировала результат уровня золотой медали на Международной математической олимпиаде (IMO), что, по мнению компании, позволяет ей составить серьезную конкуренцию ведущим западным лабораториям в области искусственного интеллекта.

Согласно данным стартапа, модель показала результаты, соответствующие золотым медалям на Международной математической олимпиаде (IMO) 2025 года и Китайской математической олимпиаде (CMO) 2024 года. Кроме того, в конкурсе Патнэма ИИ набрал 118 баллов из 120 возможных.

DeepSeekMath-V2: ИИ-модель получила уровень золотой медали на математической олимпиаде - 2

В технической документации DeepSeek объясняет, что предыдущие ИИ-модели часто выдавали правильные ответы, не демонстрируя верных промежуточных решений. Для решения этой проблемы в DeepSeekMath-V2 реализован многоэтапный процесс проверки: верификатор оценивает корректность доказательства, а метаверификатор анализирует обоснованность самой проверки. Этот подход позволяет системе самостоятельно проверять и улучшать свои решения в реальном времени.

Важно отметить, что в статье не упоминается использование внешних инструментов вроде калькуляторов или интерпретаторов кода. Архитектура модели предполагает, что все тесты проводятся исключительно с использованием естественного языка. В экспериментах одна и та же модель DeepSeekMath-V2 генерирует доказательства и проверяет их. Эффективность достигается за счет способности ИИ анализировать и совершенствовать собственные решения без привлечения внешнего математического программного обеспечения.

Для решения особо сложных задач система масштабирует вычисления во время тестирования, параллельно выбирая и проверяя множество возможных доказательств, чтобы с высокой вероятностью получить верный ответ. Технически модель основана на архитектуре DeepSeek-V3.2-Exp-Base.

 DeepseekMath-V2 полностью решила пять из шести задач IMO 2025 и четыре задачи CMO 2024. На конкурсе Putnam 2024 модель полностью решила одиннадцать задач и получила частичное решение ещё одной

DeepseekMath-V2 полностью решила пять из шести задач IMO 2025 и четыре задачи CMO 2024. На конкурсе Putnam 2024 модель полностью решила одиннадцать задач и получила частичное решение ещё одной

Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Источник

Автор: MrRjxrby

Источник

Rambler's Top100