- BrainTools - https://www.braintools.ru -
Компания Tencent выпустила новую языковую модель Hunyuan-A13B с открытым исходным кодом. В основе модели лежит динамический подход к анализу информации, который позволяет модели адаптироваться и выбирать наиболее эффективный способ решения задачи в зависимости от её сложности.

Ключевой особенностью Hunyuan-A13B является способность адаптировать глубину логического вывода в режиме реального времени. Для простых запросов используется быстрый режим, который позволяет получать ответы с минимальным логическим выводом.
Для сложных запросов активируется более глубокий процесс мышления [1], включающий многоэтапную обработку информации. Пользователи могут переключаться с помощью специальных команд: /think включает режим углублённой обработки, а /no_think отключает его.
Модель использует архитектуру «смесь экспертов» (Mixture of Experts, MoE) с 80 миллиардами общих параметров, но во время логического вывода активны только 13 миллиардов. Она поддерживает контекстные окна размером до 256 000 токенов.
Согласно техническому отчёту [2] Tencent, модель Hunyuan-A13B была обучена на 20 триллионах токенов, затем настроена для решения логических задач и доработана для более широкого спектра применения. Tencent собрала 250 миллиардов токенов из областей STEM, чтобы повысить надёжность модели при решении научных задач.
Обучающие данные включают в себя учебники по математике [3], экзаменационные работы, открытый исходный код с GitHub, сборники логических задач и научные тексты от средней школы до университетского уровня.
Tencent утверждает, что Hunyuan-A13B-Instruct может конкурировать с ведущими моделями OpenAI, Deepseek и Qwen от Alibaba. На американском математическом конкурсе AIME в 2024 году модель показала точность 87,3% по сравнению с 74,3% у OpenAI o1.
Однако, если проанализировать итоги 2025 года, то можно заметить, что подобные сопоставления не всегда дают однозначный результат — в этом случае o1 опережает своего конкурента на 3%. Tencent также опирается на устаревшую январскую версию Deepseek-R1 [4] для сравнения, хотя майская версия показала значительно более высокие результаты [5] в AIME 2024 и 2025, набрав 91,4 и 87,5 баллов соответственно.
Tencent утверждает, что модель отлично справляется с автоматизированными задачами и использованием инструментов. Во внутренних тестах A13B показал наилучшие результаты почти во всех тестах агентов. Даже при тестировании контекстов с 128 000 токенов производительность Hunyuan-A13B оставалась выше, чем у Deepseek-R1 и Qwen3-A22B, хотя и уступала Gemini 2.5 Pro.
Модель доступна по лицензии Apache 2.0 на Hugging Face [6] и GitHub [2] с готовыми к использованию образами Docker для различных платформ развертывания. Доступ к API предоставляется через Tencent Cloud [7] и демонстрационную версию для браузера [8].
Компания Tencent также выпустила два новых набора эталонных данных: ArtifactsBench [9] для генерации кода и C3-Bench [10] для оценки задач агентов.
Стратегия динамического мышления Tencent соответствует тенденциям, наблюдаемым в других ведущих лабораториях в области ИИ. Концепция переключения между различными режимами мышления перекликается с последними моделями, такими как Claude 3.7 Sonnet [11] и Qwen3 [12], которые также поддерживают адаптивное мышление.
Делегируйте часть рутинных задач вместе с BotHub [13]! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке [14] вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Перевод, оригинальная новость здесь [15].
Автор: mefdayy
Источник [16]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/16991
URLs in this post:
[1] мышления: http://www.braintools.ru/thinking
[2] техническому отчёту: https://github.com/Tencent-Hunyuan/Hunyuan-A13B
[3] математике: http://www.braintools.ru/article/7620
[4] устаревшую январскую версию Deepseek-R1: https://the-decoder.com/deepseeks-latest-r1-zero-model-matches-openais-o1-in-reasoning-benchmarks/
[5] майская версия показала значительно более высокие результаты: https://the-decoder.com/deepseeks-r1-model-closes-the-gap-with-openai-and-google-after-major-update/
[6] Hugging Face: https://huggingface.co/Tencent-Hunyuan/Hunyuan-A13B
[7] Tencent Cloud: https://cloud.tencent.com/product/hunyuan
[8] демонстрационную версию для браузера: https://hunyuan.tencent.com/ide
[9] ArtifactsBench: https://github.com/Tencent-Hunyuan/ArtifactsBenchmark
[10] C3-Bench: https://github.com/Tencent-Hunyuan/C3-Benchmark
[11] Claude 3.7 Sonnet: https://the-decoder.com/anthropic-launches-claude-3-7-sonnet-hybrid-ai-model-and-claude-code-programming-tool/
[12] Qwen3: https://the-decoder.com/qwen3-series-from-alibaba-debuts-with-benchmark-results-matching-top-competitors/
[13] BotHub: https://bothub.chat/?utm_source=contentmarketing&utm_medium=habr&utm_campaign=news&utm_content=HUNYUAN-A13B_FROM_TENCENT_A_LANGUAGE_MODEL_WITH_A_DYNAMIC_APPROACH_TO_REASONING
[14] По ссылке: https://bothub.chat/?invitedBy=m_aGCkuyTgqllHCK0dUc7
[15] здесь: https://the-decoder.com/tencents-open-source-model-hunyuan-a13b-combines-fast-and-slow-reasoning/
[16] Источник: https://habr.com/ru/companies/bothub/news/925210/?utm_source=habrahabr&utm_medium=rss&utm_campaign=925210
Нажмите здесь для печати.