- BrainTools - https://www.braintools.ru -
IBM выпустила [1] семейство открытых языковых моделей Granite 4.0 с числом параметров от 3 до 32 млрд. Все модели доступны под лицензией Apache 2.0 и поддерживают контекстное окно в 128 тысяч токенов. В линейку вошли Granite 4.0 H Small (32B/9B активных параметров), H Tiny (7B/1B), H Micro (3B/3B) и Micro (3B/3B).
Архитектура Granite 4.0 сочетает классические слои внимания [2] трансформера с большим числом слоев типа Mamba — моделей со скрытым состоянием (state-space models, SSM). Такой гибрид, по данным IBM, снижает требования к памяти [3] и ускоряет работу на длинных последовательностях без ощутимой потери качества. Модель Granite 4.0 H Small уже доступна на Replicate по цене $0,06 за миллион входных и $0,25 за миллион выходных токенов; все четыре модели можно загрузить с Hugging Face [4].

По агрегированному индексу Artificial Analysis Intelligence Index, который объединяет десять строгих бенчмарков (от MMLU-Pro до GPQA Diamond), Granite 4.0 H Small набрала 23 балла — это на восемь пунктов выше Granite 3.3 8B и на один пункт выше Gemma 3 27B (22). Granite 4.0 Micro (3B параметров) получила 16 баллов, опередив Gemma 3 4B (15).
Особо исследователи отметили токенную эффективность Granite 4.0: для прохождения набора тестов H Small использовала около 5,2 млн выходных токенов, а Micro — 6,7 млн. Это меньше, чем у большинства открытых моделей до 40 млрд параметров, что означает более низкие затраты при практическом использовании.
Длинный контекст в 128K и сниженные вычислительные требования делают Granite 4.0 удобной для задач извлечения знаний из документов и Retrieval-Augmented Generation (RAG), а открытая лицензия и поддержка дообучения (например, через LoRA) позволяют компаниям адаптировать модели под свои домены.
P.S. Поддержать меня можно подпиской на канал “сбежавшая нейросеть [5]“, где я рассказываю про ИИ с творческой стороны.
Автор: runaway_llm
Источник [6]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/20224
URLs in this post:
[1] выпустила: https://x.com/ArtificialAnlys/status/1973746432692936963
[2] внимания: http://www.braintools.ru/article/7595
[3] памяти: http://www.braintools.ru/article/4140
[4] Hugging Face: https://huggingface.co/ibm-granite
[5] сбежавшая нейросеть: https://t.me/ai_exee
[6] Источник: https://habr.com/ru/news/952906/?utm_source=habrahabr&utm_medium=rss&utm_campaign=952906
Нажмите здесь для печати.