Kimi представили новую модель — Kimi-Linear-48B-A3B-Base. ai.. ai. kdab.. ai. kdab. Moonshot AI.. ai. kdab. Moonshot AI. Блог компании BotHub.. ai. kdab. Moonshot AI. Блог компании BotHub. Будущее здесь.. ai. kdab. Moonshot AI. Блог компании BotHub. Будущее здесь. ИИ.. ai. kdab. Moonshot AI. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект.. ai. kdab. Moonshot AI. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. Машинное обучение.. ai. kdab. Moonshot AI. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. Машинное обучение. научно-популярное.. ai. kdab. Moonshot AI. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. Машинное обучение. научно-популярное. нейросети.
Kimi представили новую модель — Kimi-Linear-48B-A3B-Base - 1

Команда Moonshot AI показала очередной серьёзный шаг в сторону эффективных больших моделей. Новая архитектура объединяет два подхода (Gated DeltaNet и MLA-компрессию), создавая гибрид под названием KDA (Kimi Delta Attention). Это решение помогает модели лучше работать с длинным контекстом, сохраняя высокое качество рассуждений и при этом не раздувая вычислительные затраты.

Kimi представили новую модель — Kimi-Linear-48B-A3B-Base - 2

Главная идея KDA — не пересчитывать всё внимание на каждом токене, а фокусироваться только на изменениях. Это даёт значительный прирост скорости и экономию памяти. Внутри архитектуры внимание распределено в пропорции примерно 3:1. Три части KDA и одна часть MLA. Такой баланс позволяет модели поддерживать стабильность и точность на уровне крупных LLM, но с гораздо меньшими требованиями к ресурсам.

Kimi представили новую модель — Kimi-Linear-48B-A3B-Base - 3

В результате Kimi-Linear-48B требует до 75% меньше памяти на KV-кэш и обеспечивает ускорение декодирования до 6,3 раз на длинных контекстах. При этом она не теряет в качестве, наоборот, на задачах рассуждения и генерации длинных цепочек показывает лучшие результаты, чем MLA и GDN-H.

Модель демонстрирует устойчивость к распаду длинных зависимостей, умеет решать, что стоит забыть, а что запомнить, и сохраняет целостность рассуждений даже при экстремально больших контекстах. Это делает её особенно подходящей для долгих диалогов, сложных цепочек reasoning и RL-задач.


Хотите быть в курсе важных новостей из мира ИИ? Подписывайтесь на наш Telegram‑канал BotHub AI News.

Автор: cognitronn

Источник

Rambler's Top100