Релиз Qwen3.7-Max: лучше Claude Opus 4.6 на SWE-bench Pro

Alibaba выпустили ^[1] Qwen3.7-Max: флагманскую закрытую модель серии Qwen3.

Главный кейс из релиза: модель 35 часов работала полностью автономно, сделала 1158+ вызовов инструментов и самостоятельно оптимизировала низкоуровневое CUDA-ядро для работы с длинным контекстом на железе, на котором никогда не обучалась. Результат 10x прирост скорости инференса.

Релиз Qwen3.7-Max: лучше Claude Opus 4.6 на SWE-bench Pro - 2

Контекстное окно 1M токенов, только текст (мультимодальности в этом релизе нет). По бенчмаркам: SWE-bench Pro — 60.6% (выше DeepSeek V4-Pro, но ниже Claude Opus 4.7 с 64.3%).

Релиз Qwen3.7-Max: лучше Claude Opus 4.6 на SWE-bench Pro - 3

Интересно, что модель специально тестировали на трёх разных харнессах (OpenClaw, Claude Code и Hermes). Разброс результатов — в пределах ~6 пунктов.

Релиз Qwen3.7-Max: лучше Claude Opus 4.6 на SWE-bench Pro - 4

Доступна через Qwen Studio (chat.qwen.ai ^[2]) и Alibaba Cloud Model Studio (API). Веса Max-версии не открывают. Plus-версия серии Qwen3.7 уйдёт в open-source.

Русскоязычное сообщество про AI в разработке

Релиз Qwen3.7-Max: лучше Claude Opus 4.6 на SWE-bench Pro - 5

Друзья! Эту новость подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-агентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь ^[3], чтобы быть в курсе и ничего не упустить!

Автор: python_leader

Источник ^[4]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/30585

URLs in this post:

[1] выпустили: https://qwen.ai/blog?id=qwen3.7

[2] chat.qwen.ai: http://chat.qwen.ai

[3] Подписывайтесь: https://t.me/+pj9uA9atqz9hZTA6

[4] Источник: https://habr.com/ru/news/1037876/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1037876

Нажмите здесь для печати.