- BrainTools - https://www.braintools.ru -

Полное имя билда: Kimi K2 0905.
Модель обходит даже Claude 4 Sonnet почти по всем бенчам. Аналогично и с Gemini 2.5 Pro.
Веса — клик
Отчёт — клик (больше бенчей внутри)
Архитектура: Mixture‑of‑Experts, 32B активных параметров, ~1T total.
Обновление 0905: поддержка agentic coding + контекст до 256K.
Релизы:
Kimi-K2-Base — база для дообучения.
Kimi-K2-Instruct — версия для чатов и агентов (быстрая, без «long thinking»).
Тренировка: 15.5T токенов, оптимизатор MuonClip (qk‑clip) — стабилизирует обучение [1] и убирает всплески логитов внимания [2].
Оптимизация архитектуры: меньше голов для длинного контекста, больше разреженности в MoE, близко к DeepSeek‑V3.
Агентность: встроенный тул‑юзинг (MCP и синтетические инструменты), генерация агентных данных + общий RL с self‑judge (работает и на проверяемых задачах, и на творческих).



Примечания из отчёта: Tau2 — взвешенное среднее; на Swe‑Bench Multilingual сравнивали с Claude Sonnet (Opus пропустили из‑за цены); подчёркнутые/жирные — SOTA, часть метрик взята из техрепортов моделей.
Модель можно подключать к своим инструментам без ручного прописывания сценариев. Примеры в отчёте: анализ зарплат с визуализациями, генерация сайтов и планировщиков, автоматизация через терминал, даже прототип Minecraft на JS.
Веса — клик [3]
Отчет — клик [4] (тут больше бенчей, с телефона что то не могу прикрепить остальные)
Друг Опенсурса [6]
Автор: Qwertcoser
Источник [7]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/19170
URLs in this post:
[1] обучение: http://www.braintools.ru/article/5125
[2] внимания: http://www.braintools.ru/article/7595
[3] клик: https://huggingface.co/moonshotai/Kimi-K2-Instruct-0905
[4] клик: https://moonshotai.github.io/Kimi-K2/
[5] Все полезные нейронки тут: https://umaai.site/
[6] Друг Опенсурса: https://t.me/tch_net
[7] Источник: https://habr.com/ru/news/944234/?utm_source=habrahabr&utm_medium=rss&utm_campaign=944234
Нажмите здесь для печати.