- BrainTools - https://www.braintools.ru -

Исследователи Microsoft заявили, что разработали сверхэффективную модель ИИ, которая может работать на CPU

Исследователи Microsoft заявили [1], что создали самую масштабную на сегодняшний день 1-битную модель ИИ, также известную как «битнет». Модель получила название BitNet b1.58 2B4T, она открыта для использования по лицензии MIT и может запускаться на процессорах, включая Apple M2.

Битнеты — это сжатые модели, предназначенные для работы на маломощном оборудовании. В обычных моделях веса — значения, определяющие внутреннюю структуру модели — часто квантуются, чтобы обеспечить эффективную работу на различных устройствах. Квантование снижает количество битов, необходимых для представления этих весов, что позволяет моделям работать на чипах с меньшим объёмом памяти [2] и с большей скоростью.

В битнетах веса квантуются до всего трёх значений: -1, 0 и 1. Теоретически это делает их значительно более эффективными с точки зрения [3] памяти и вычислений по сравнению с большинством современных моделей.

По словам исследователей, BitNet b1.58 2B4T — это первый битнет с 2 миллиардами параметров (а «параметры» по сути означают те же веса). Он был обучен на датасете, содержащем 4 триллиона токенов — что примерно эквивалентно 33 миллионам книг. Исследователи утверждают, что BitNet b1.58 2B4T превосходит традиционные модели аналогичного размера.

Хотя BitNet b1.58 2B4T не «разрывает» конкурентов с аналогичным числом параметров, он, по-видимому, не уступает им. Согласно результатам тестирования, модель обошла Llama 3.2 1B от Meta, Gemma 3 1B от Google и Qwen 2.5 1.5B от Alibaba по ряду бенчмарков, включая GSM8K (набор задач по математике [4] уровня начальной школы) и PIQA (тесты на физический здравый смысл).

Что ещё более впечатляет — BitNet b1.58 2B4T работает быстрее других моделей такого же размера — в некоторых случаях в два раза быстрее — и при этом использует гораздо меньше памяти.

Однако есть одно «но».

Чтобы достичь таких показателей, необходимо использовать фреймворк Microsoft — bitnet.cpp, который пока работает только на определённом оборудовании. В списке поддерживаемых чипов отсутствуют графические процессоры (GPU), которые сейчас доминируют в инфраструктуре ИИ.

Иными словами, у битнетов есть потенциал — особенно для устройств с ограниченными ресурсами. Но вопрос совместимости остаётся (и, скорее всего, останется) серьёзным препятствием.

  1. Репозитарий и видео с описанием доступны по ссылке [5].

  2. Оригинал новости [6]

Автор: alan_dani

Источник [7]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/14336

URLs in this post:

[1] заявили: https://arxiv.org/abs/2402.17764

[2] памяти: http://www.braintools.ru/article/4140

[3] зрения: http://www.braintools.ru/article/6238

[4] математике: http://www.braintools.ru/article/7620

[5] ссылке: https://github.com/microsoft/BitNet

[6] Оригинал новости: https://techcrunch.com/2025/04/16/microsoft-researchers-say-theyve-developed-a-hyper-efficient-ai-model-that-can-run-on-cpus/

[7] Источник: https://habr.com/ru/news/901588/?utm_source=habrahabr&utm_medium=rss&utm_campaign=901588

www.BrainTools.ru

Rambler's Top100