- BrainTools - https://www.braintools.ru -

Microsoft запустила внедрение второго поколения собственного ИИ-ускорителя Maia, делая еще один шаг к снижению зависимости от Nvidia и оптимизации затрат на инфраструктуру. Новые чипы уже устанавливаются в дата-центрах компании в США, а для разработчиков открыт доступ к SDK. При этом сроки публичного запуска инстансов Maia 200 в Azure пока официально не объявлены.
Maia 200 производится по 3-нм техпроцессу и содержит более 140 млрд транзисторов. Архитектура изначально проектировалась под инференс крупных моделей. Заявленная производительность превышает 10 петафлопс в FP4 и достигает 5 петафлопс в FP8, что делает чип ориентированным на массовый продакшен ИИ-сервисов.

Подсистема памяти [1] выглядит особенно агрессивно. Ускоритель оснащен 216 ГБ HBM3e с пропускной способностью до 7 ТБ/с, а также 272 МБ сверхбыстрого SRAM-кэша прямо на кристалле. Энергопакет одного чипа составляет 750 Вт, что вписывается в современные дата-центровые стандарты для high-end ИИ-железа.
По внутренним тестам Microsoft, Maia 200 работает примерно в три раза быстрее Amazon Trainium 3 и превосходит Google TPU v7 в задачах FP8-инференса. Чип также поддерживает масштабирование в кластеры до 6144 ускорителей без потери эффективности, что критично для крупных моделей.

Отдельный акцент компания делает на экономике. По показателю производительности на доллар Maia 200 примерно на 30% эффективнее актуальных решений конкурентов. Если эти цифры подтвердятся в продакшене, Microsoft получит серьезное преимущество в стоимости инференса своих ИИ-сервисов.
Делегируйте часть рутинных задач вместе с BotHub! [2] Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке [3] вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Автор: cognitronn
Источник [4]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/24900
URLs in this post:
[1] памяти: http://www.braintools.ru/article/4140
[2] BotHub!: https://bothub.chat/?utm_source=contentmarketing&utm_medium=habr&utm_campaign=news&utm_content=MICROSOFT%20STARTS%20ROLLING%20OUT%20MAIA%20200%20ACCELERATOR
[3] По ссылке: https://bothub.chat/?invitedBy=m_aGCkuyTgqllHCK0dUc7
[4] Источник: https://habr.com/ru/companies/bothub/news/990434/?utm_source=habrahabr&utm_medium=rss&utm_campaign=990434
Нажмите здесь для печати.