- BrainTools - https://www.braintools.ru -

Kimi представили новую модель — Kimi-Linear-48B-A3B-Base

Kimi представили новую модель — Kimi-Linear-48B-A3B-Base - 1

Команда Moonshot AI показала очередной серьёзный шаг в сторону эффективных больших моделей. Новая архитектура [1]объединяет два подхода (Gated DeltaNet и MLA-компрессию), создавая гибрид под названием KDA (Kimi Delta Attention). Это решение помогает модели лучше работать с длинным контекстом, сохраняя высокое качество рассуждений и при этом не раздувая вычислительные затраты.

Kimi представили новую модель — Kimi-Linear-48B-A3B-Base - 2

Главная идея KDA — не пересчитывать всё внимание [2] на каждом токене, а фокусироваться только на изменениях. Это даёт значительный прирост скорости и экономию памяти [3]. Внутри архитектуры внимание распределено в пропорции примерно 3:1. Три части KDA и одна часть MLA. Такой баланс позволяет модели поддерживать стабильность и точность на уровне крупных LLM, но с гораздо меньшими требованиями к ресурсам.

Kimi представили новую модель — Kimi-Linear-48B-A3B-Base - 3

В результате Kimi-Linear-48B требует до 75% меньше памяти на KV-кэш и обеспечивает ускорение декодирования до 6,3 раз на длинных контекстах. При этом она не теряет в качестве, наоборот, на задачах рассуждения и генерации длинных цепочек показывает лучшие результаты, чем MLA и GDN-H.

Модель [4]демонстрирует устойчивость к распаду длинных зависимостей, умеет решать, что стоит забыть, а что запомнить, и сохраняет целостность рассуждений даже при экстремально больших контекстах. Это делает её особенно подходящей для долгих диалогов, сложных цепочек reasoning и RL-задач.


Хотите быть в курсе важных новостей из мира ИИ? Подписывайтесь на наш Telegram‑канал BotHub AI News [5].

Автор: cognitronn

Источник [6]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/21389

URLs in this post:

[1] Новая архитектура : https://github.com/MoonshotAI/Kimi-Linear

[2] внимание: http://www.braintools.ru/article/7595

[3] памяти: http://www.braintools.ru/article/4140

[4] Модель : https://huggingface.co/moonshotai/Kimi-Linear-48B-A3B-Instruct

[5] BotHub AI News: https://t.me/bothub

[6] Источник: https://habr.com/ru/companies/bothub/news/962248/?utm_source=habrahabr&utm_medium=rss&utm_campaign=962248

www.BrainTools.ru

Rambler's Top100