Google тестирует новые чипы для ИИ. искусственный интеллект.
Лоток с чипами TPU нового поколения от Google в лаборатории компании в Маунтин-Вью, Калифорния.

Поднос с чипами TPU нового поколения от Google в лаборатории компании в Маунтин-Вью, Калифорния.

За несколько месяцев чипы Google для ИИ стали одним из самых востребованных товаров в технологическом секторе. Ведущие разработчики в области искусственного интеллекта, в том числе некоторые из главных конкурентов компании, закупают их в больших количествах.

Google готовит новое поколение AI-чипов TPUv8, которое будет разделено на два специализированных решения. Линейка заменит текущее поколение TPUv7 и сосредоточится на разделении задач между обучением и инференсом.

Чип TPUv8i под кодовым названием Zebrafish будет ориентирован на инференс и разрабатывается при участии MediaTek. В то же время TPUv8t (Sunfish) предназначен для обучения моделей и создается совместно с Broadcom. Такой подход позволяет оптимизировать производительность и стоимость для разных типов AI-нагрузок.

Обе модели будут тесно интегрированы с процессорами Axion на архитектуре Arm. Новая стратегия отражает стремление Google повысить эффективность своих дата-центров и укрепить позиции в сегменте специализированных AI-ускорителей.

По мере роста спроса на быструю обработку запросов к искусственному интеллекту «становится целесообразным специализироваться на чипах, предназначенных либо для обучения, либо для логического вывода», — заявил в интервью главный научный сотрудник Google Джефф Дин. «Мы рассматриваем целый ряд различных вариантов», — добавил он, в том числе возможность повысить скорость получения результатов работы ИИ.

Графические процессоры Nvidia остаются золотым стандартом для искусственного интеллекта, особенно для обучения более продвинутых моделей. Однако все больше перспективных компаний пытаются составить конкуренцию этому производителю чипов в области логического вывода, в том числе предлагая чипы, призванные сократить время отклика чат-ботов и агентов искусственного интеллекта. В прошлом месяце Nvidia начала продавать чип, предназначенный для более быстрого логического вывода на основе технологии, которую компания приобрела у Groq в рамках лицензионной сделки на сумму 20 миллиардов долларов.

«Поле битвы смещается в сторону логического вывода», — говорит Чираг Декате, аналитик из Gartner, отмечая, что, по его опыту, модель Gemini от Google быстрее всего справляется со сложными задачами, требующими логических рассуждений. «В этой сфере у Google есть преимущество в инфраструктуре».

По словам Натали Серрино, соучредителя Gimlet Labs, стартапа, разрабатывающего программное обеспечение для распределения задач искусственного интеллекта между наиболее подходящими для каждой из них чипами, современные TPU уже сейчас являются отличным выбором для обработки результатов работы новых ИИ-агентов, которые выполняют более сложные задачи от имени пользователя. «Это очень хорошие инструменты для растущих объемов работы», — сказала она.

В октябре усилия Google по разработке чипов, которые велись уже давно, вновь привлекли к себе внимание, когда компания Anthropic PBC — один из самых известных разработчиков искусственного интеллекта — объявила о расширении соглашения на доступ к до 1 миллиону тензорных процессоров. В следующем месяце Google представила более совершенную модель Gemini 3, обученную и работающую на тензорных процессорах, которая получила восторженные отзывы.

С тех пор спрос на чипы Google со стороны крупных компаний только вырос. Meta Platforms Inc. заключила многомиллиардную сделку на использование TPU через Google Cloud на несколько лет. Компания только что получила доступ к первой крупной партии чипов и тестирует их, чтобы понять, для каких задач они лучше всего подходят, сообщил Сантош Джанардхан, руководитель отдела инфраструктуры Meta. «Похоже, что у них действительно есть преимущества в логическом выводе», — сказал он, отметив при этом, что «ни одна новая платформа не обходится без трудностей и периода адаптации».

Anthropic также заключила сделку с Broadcom Inc., партнером Google по TPU, на поставку чипов, которые позволят компании использовать вычислительную мощность около 3,5 гигаватт, начиная с 2027 года.

Citadel Securities планирует представить на конференции Google доклад о том, как TPU позволяют компании обучать модели быстрее, чем при использовании графических процессоров. По словам Талала Аль-Каисси, временного генерального директора Core42, облачного подразделения технологического конгломерата из Абу-Даби, компания G42 провела «множество переговоров» с Google об использовании своих тензорных процессоров. «Я настроен оптимистично», — сказал Аль-Каисси о переговорах.

Новейшая версия чипа TPU от Google

Новейшая версия чипа TPU от Google

Google уже предпринимает новые шаги, чтобы идти навстречу клиентам. Компания тестирует возможность предоставления таким компаниям, как Anthropic, доступа к некоторым из своих TPU в собственных центрах обработки данных, а не на объектах Google. По словам Вахдата, это также позволит клиентам TPU использовать сторонние инструменты, такие как PyTorch, а также другое программное обеспечение для планирования, а не полагаться исключительно на продукты Google.

Кроме того, Google создала системы для более быстрого выявления производственных дефектов, которые могут оказывать огромное влияние на программное обеспечение. По словам Пола Бархэма, выдающегося ученого Google, который является одним из руководителей команды разработчиков инфраструктуры Gemini, при работе с чипами-ускорителями искусственного интеллекта, которые выполняют огромное количество математических операций, даже незначительный сбой может привести к «полному самоуничтожению» модели. По его словам, подобная проблема возникла в Google около двух лет назад, и на ее устранение ушли недели. Он назвал такие сбои «адскими ошибками».

«Теперь нам нужно проделать то же самое с сотнями тысяч микросхем ускорителя за 10 секунд», — сказал он.

Несмотря на свой опыт в разработке искусственного интеллекта, Google сталкивается с той же проблемой, что и другие производители чипов: на разработку чипов от начала и до конца обычно уходит около трех лет, но модели искусственного интеллекта развиваются гораздо быстрее. Из-за этого сложно предсказать, что будет востребовано у клиентов через несколько лет.

«Если кто-то утверждает, что знает, как будет выглядеть Gemini 10, я говорю: «Пожалуйста, поделитесь со мной тем, что вы курите», — сказал Ранганатан.

Бархэм также обеспокоен тем, что тесная обратная связь между разработчиками моделей искусственного интеллекта и проектировщиками аппаратного обеспечения может привести к тому, что новые идеи останутся незамеченными. По его словам, «этот цикл загоняет вас в ловушку, заставляя использовать то, что хорошо работает на текущем программном и аппаратном обеспечении».

По мере роста популярности чипов Google компания рискует столкнуться с проблемами с поставками, как и Nvidia. Один из руководителей стартапа рассказал, что использование TPU в их компании ограничено из-за их нехватки, и пожаловался, что Google фактически отдала все свои чипы компании Anthropic.

Автор: nikolz

Источник