
Google столкнулся с беспрецедентным ростом нагрузки на свои ИИ-сервисы и теперь, по словам вице-президента по облачным инфраструктурам Амина Вахдата, компании приходится удваивать мощности для обслуживания ИИ каждые шесть месяцев. Это заявление прозвучало на внутреннем собрании 6 ноября, где сотрудникам показали слайд с фразой: «Now we must double every 6 months… the next 1000× in 4–5 years». То есть Google ожидает увеличение нагрузки примерно в тысячу раз уже в ближайшие годы – и готовит инфраструктуру к такой экспоненте.
Рост расходов становится неизбежным. Google поднял прогноз капитальных затрат до 91-93 млрд долларов в год, и основной объём этой суммы уходит на серверы, хранилища и сетевые системы. Причина проста: запросы к моделям становятся более масштабными, сами модели – сложнее, а применение ИИ расширяется на всю экосистему Google, включая поиск, Workspace, Cloud и продукты для разработчиков. Даже при активной оптимизации компании не удаётся сдержать взрывной рост нагрузки.
При этом Google подчёркивает, что просто наращивать дата-центры недостаточно. Компания делает ставку на собственные чипы и оптимизацию моделей. Вахдат отметил, что новый TPU Ironwood и другие архитектурные улучшения должны значительно повысить энергоэффективность и снизить стоимость вычислений при росте качества моделей. Это важно, потому что вертикальные затраты на ИИ растут быстрее, чем успевает расти инфраструктура, и если Google не ускорится, предложение мощности отстанет от спроса клиентов и собственных сервисов.
Внутренние прогнозы в компании однозначны. Отставание по инфраструктуре сегодня представляет больший риск, чем чрезмерные инвестиции. Спрос на генеративный ИИ уже превышает предложение мощностей, и любое замедление роста вычислительных ресурсов может стать критическим узким местом. По сути, Google оказался в ситуации, где единственный способ удержаться в гонке – постоянно и агрессивно наращивать способность обслуживать ИИ-модели, причём в два раза каждые полгода. Будем следить за новостями!
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Автор: cognitronn


