- BrainTools - https://www.braintools.ru -
На этой неделе на конференции Cloud Next компания Google представила новейшее поколение своего чипа-ускорителя искусственного интеллекта [1] TPU. Новый чип, названный Ironwood, является седьмым поколением TPU от Google и первым, оптимизированным для вывода — то есть запуска моделей AI. Планируемый к запуску в конце этого года для клиентов Google Cloud, Ironwood будет поставляться в двух конфигурациях: кластер из 256 чипов и кластер из 9216 чипов.

«Ironwood — наш самый мощный, способный и энергоэффективный TPU на сегодняшний день», — написал вице-президент Google Cloud Амин Вахдат в сообщении в блоге, предоставленном TechCrunch. «И он специально создан для поддержки мышления [2], выводных моделей AI в масштабе».
Ironwood появляется, когда конкуренция в области ускорителей AI накаляется. Nvidia может быть лидером, но технологические гиганты, включая Amazon и Microsoft, продвигают свои собственные внутренние решения. У Amazon есть процессоры Trainium [3], Inferentia [4] и Graviton [5], доступные через AWS, а Microsoft размещает [6] экземпляры Azure для своего чипа AI Maia 100.
Ironwood может обеспечить 4614 TFLOPs вычислительной мощности на пике, согласно внутреннему бенчмаркингу Google. Каждый чип имеет 192 ГБ выделенной оперативной памяти [7] с пропускной способностью, приближающейся к 7,4 Тбит/с.
Ironwood имеет усовершенствованное специализированное ядро SparseCore для обработки типов данных, распространенных в рабочих нагрузках «расширенного ранжирования» и «рекомендаций» (например, алгоритм, предлагающий одежду, которая вам может понравиться). Архитектура TPU была разработана для минимизации перемещения данных и задержек на чипе, что приводит к экономии энергии, утверждает Google.
Вахдат добавил, что в ближайшем будущем Google планирует интегрировать Ironwood со своим AI Hypercomputer — модульным вычислительным кластером в Google Cloud.
«Ironwood представляет собой уникальный прорыв в эпоху вывода», — сказал Вахдат, — «благодаря возросшей вычислительной мощности, объему памяти, достижениям в области сетевых технологий и надежности».
Источник [8]
Автор: dilnaz_04
Источник [9]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/14073
URLs in this post:
[1] интеллекта: http://www.braintools.ru/article/7605
[2] мышления: http://www.braintools.ru/thinking
[3] Trainium: https://techcrunch.com/2024/12/03/aws-trainium2-chips-for-building-llms-are-now-generally-available-with-trainium3-coming-in-late-2025/
[4] Inferentia: https://techcrunch.com/2022/11/29/amazon-announces-preview-of-new-inf2-instances-designed-for-larger-models/
[5] Graviton: https://techcrunch.com/2023/11/28/amazon-unveils-new-chips-for-training-and-running-ai-models/
[6] размещает: https://techcrunch.com/2024/05/16/microsofts-custom-cobalt-chips-will-come-to-azure-next-week/
[7] памяти: http://www.braintools.ru/article/4140
[8] Источник: https://techcrunch.com/2025/04/09/google-unveils-ironwood-a-new-ai-accelerator-chip/
[9] Источник: https://habr.com/ru/companies/bothub/news/899348/?utm_source=habrahabr&utm_medium=rss&utm_campaign=899348
Нажмите здесь для печати.