- BrainTools - https://www.braintools.ru -

Новый 3-битный алгоритм Google заставил рынок переоценить ИИ-индустрию

Индустрия искусственного интеллекта [1] годами развивалась по пути грубой силы — бесконечного наращивания вычислительных мощностей. Но когда физические пределы «железа» стали очевидны, в игру вернулась чистая математика [2].

В среду, 25 марта 2026 года, на биржах произошла аномалия. Пока индекс Nasdaq уверенно рос, акции гигантов индустрии памяти [3] — Micron, Western Digital, Seagate [4], а также производителей оборудования Lam Research и Applied Materials — синхронно ушли в минус [5]. Триггером стала не геополитика и не сбои в логистике, а публикация одной научной статьи от Google Research [6].

Команда инженеров Google представила TurboQuant — алгоритм, способный сжать так называемый KV-кэш (память, в которой нейросеть удерживает контекст диалога) до 3 бит. И самое важное: алгоритм не снижает точность ответов и ускоряет вычисления в 8 раз [7] на чипах NVIDIA H100.

До этого момента индустрия решала проблему огромных контекстов грубой силой: просто закупала всё больше дорогих чипов памяти. Инженеры Google предложили альтернативу — перестать раздувать аппаратные мощности и переписать саму математику работы ИИ с данными.

Алгоритмический прорыв Google отразится на производителях «железа»

Биржевая паника или парадокс [8] Джевонса? Аналитики Уолл-стрит расходятся в оценках того, как алгоритмический прорыв Google отразится на производителях «железа». Источник: CNBC

Квантование полярных координат

В основе TurboQuant лежит отказ от привычных систем координат. Современные алгоритмы теряют критически важные данные, когда пытаются сжать информацию сильнее 4 бит. Google обошла этот барьер с помощью квантования полярных координат PolarQuant.

Вместо того чтобы хранить тяжелые многомерные координаты данных, алгоритм переводит их в полярную систему — запоминает только радиус и угол. Оказалось, что для нейросетей направление вектора куда важнее точного расстояния. А неизбежные при таком жестком сжатии ошибки [9] алгоритм аккуратно сглаживает дополнительным модулем QJL (Quantized Johnson-Lindenstrauss) — он просто прячет лишний «шум» в безопасное математическое пространство, где тот не мешает вычислениям.

Этот изящный трюк создает неожиданную проблему даже для гегемона рынка — NVIDIA. Софтверный буст делает их текущие чипы H100 настолько эффективными, что клиенты могут решить подождать и отложить закупку новых, более дорогих процессоров.

Реакция рынка

Торговые алгоритмы Уолл-стрит отреагировали прямолинейно: если Google в шесть раз сокращает потребность [10] ИИ в памяти, значит, дата-центрам больше не нужно скупать SSD и чипы в прежних объемах.

Однако аналитики Morgan Stanley призывают не паниковать [11]. Они называют долгосрочный эффект для производителей железа «нейтрально-позитивным». Срабатывает парадокс Джевонса: когда ресурс становится использовать проще и дешевле, его потребление не падает, а наоборот — взлетает.

Снижение требований к памяти сильно удешевит запуск ИИ. Нейросети, которым раньше требовались целые серверные стойки, теперь смогут работать локально или на дешевом оборудовании. Это не убьет спрос на кремний, а откроет двери для тысяч новых проектов, которые раньше были просто не по карману.

Официально TurboQuant покажут в апреле на конференции ICLR 2026 в Рио-де-Жанейро [12]. И, кажется, это отличный сигнал: индустрия ИИ перестает решать все проблемы исключительно грубой силой. Гонка «железа» никуда не денется, но теперь выигрывать в ней будут не только бесконечными бюджетами на память, но и красивой математикой.

Автор: ARad

Источник [13]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/27749

URLs in this post:

[1] интеллекта: http://www.braintools.ru/article/7605

[2] математика: http://www.braintools.ru/article/7620

[3] памяти: http://www.braintools.ru/article/4140

[4] Micron, Western Digital, Seagate: https://za.investing.com/news/stock-market-news/mu-wdc-sndk-fall-why-googles-turboquant-is-rattling-memory-stocks-4181755

[5] синхронно ушли в минус: https://www.benzinga.com/trading-ideas/movers/26/03/51466825/memory-stocks-slide-as-googles-new-ai-efficiency-breakthrough-may-slash-data-storage-needs

[6] Google Research: https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/

[7] алгоритм не снижает точность ответов и ускоряет вычисления в 8 раз: https://www.tomshardware.com/tech-industry/artificial-intelligence/googles-turboquant-compresses-llm-kv-caches-to-3-bits-with-no-accuracy-loss

[8] парадокс: http://www.braintools.ru/article/8221

[9] ошибки: http://www.braintools.ru/article/4192

[10] потребность: http://www.braintools.ru/article/9534

[11] Morgan Stanley призывают не паниковать: https://www.moomoo.com/news/post/67409444/google-announced-a-kv-cache-compression-technology-which-is-expected

[12] ICLR 2026 в Рио-де-Жанейро: https://iclr.cc/Conferences/2026/VisaTravel

[13] Источник: https://habr.com/ru/news/1015190/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1015190

www.BrainTools.ru

Rambler's Top100