Мир не успевает за ИИ лабораториями

В конце прошлого года появилась новая тема для психоза вокруг нейосетей. На этот раз ей стали кодинг агенты.

Люди говрят, что это новая эра в программировании и бла бла бла.

Твит от Андрея Карпати ^[1] в конце зимы:

Трудно передать, насколько сильно программирование изменилось из-за ИИ за последние 2 месяца: не постепенно, не в режиме “обычный прогресс”, а резко и с этого декабря. С оговорками, но по большому счёту кодинг-агенты до декабря не работали, а после в целом работают.

Модели стали гораздо качественнее, лучше держат долгосрочную связность и упорно продираются через большие и длинные задачи. Достаточно хорошо, чтобы это радикально ломало привычный процесс программирования.

Спустя несколько месяцев у нас есть уже не просто чьи то слова, а подтверждение в цифрах. О том, что на рынке действительно происходит что то из ряда вон.

Кодинг агенты стали первым ИИ продуктом, когда люди начали много и регулярно платить за прямое ускорение работы. Пока рано утверждать, что бизнес массово заменяет процессы агентами. Но спрос на вычислительные мощности начал расти быстрее, чем их успевают строить.

Дальше расскажу про то, почему это уникальный момент в истории, почему к нему никто не готов и какие выводы я сделал для себя лично.

Про цифры

OpenAI и Anthropic возможно скоро решатся на IPO. И поэтому с большим энтузиазмом постят ^[2] как у них растет выручка.

И это очень много денег!

Anthropic с начала года выросли в 3 раза. При том, что они уже большая компания. А чем ты больше, тем сложнее продолжать расти с прежней скоростью.

Даже когда складывались уникальные условия в прошлом, таких цифр не было ни у кого (с натяжкой, поясню ниже). Например, Zoom в пандемию, Google в момент их выхода на IPO, Coinbase когда они заработали на комиссиях на хайпе крипты. Это компании, которые в 5-10 раз меньше Anthropic, которые находились в особой ситуации и все равно росли медленнее.

Cобрал примеры самых удачных периодов роста компаний в их лучший год. Тут только те, кто уже стал крупным. Считал выручку на начало и конец года.

С натяжкой, потому что во первых были еще производители вакцины во время пандемии, а во вторых цифры Антропиков – это прогноз на остаток года по его началу. Еще они не совсем одинаково считают по сравнению с OpenAI. Но это не особо важно и вывод не меняет:

Бабки это крутой признак реального спроса на агентские системы.

Когда в прошлом году куча людей вдруг узнало, что ChatGPT умеет генерить классные картинки, к большим деньгам это не привело.

Сейчас же, только за один январь число коммитов от Claude Code на GitHub (в публично доступных репах) выросло ^[3] с 2% до 4%. Если кажется мало, то учтите, что это всего за месяц и без учета Кодекса, Копайлота и Девина. К концу года ребята прогнозируют что Клод дорастёт с 4% до 20%+.

Даже если подписка за 100$ может автоматизировать небольшую часть работы, это все равно не сравнится с зарплатой специалиста. Для медианной зарплаты в 350-500$ в день, ROI подписки для 10% самой простой и рутинной работы человека будет в 10-30 раз больше.

Тут дальше можно много спорить.

Давайте я даже сам вам накидаю слабые моменты в моей логике ^[4].

Ну и что, что у них растут доходы, лабы всё еще убыточны как бизнес. Им выгодно раздувать хайп, чтобы привлекать себе самые готовые к риску компании. Платят не большие компании, а ранние энтузиасты, которые как пришли, так и уйдут. Сколько пузырей уже так лопнуло.

Агенты нестабильны и все еще могут косячить и ошибаться. Кто потом за последствия отвечать будет? Людей пока невозможно заменить, потому что серьезному бизнесу важна устойчивость. Ну может только джунов, и то не полностью. А откуда потом без джунов взрослые специалисты появятся?

Агенты пока адекватно справляются только с узким набором задач. Даже если код писать стало быстрее, выпуск продукта будет упираться в сбор требований, архитектуру, ревью, тестирование и наши любимые созвоны, согласования и регуляторку.

Я для себя решил, что нужно в какой то момент определиться и занять позицию невзирая на недостаток доказательств.

Финишную черту можно передвигать бесконечно. Когда то в машинном обучении ^[5] reasoning был абсолютно недоступной высотой для моделей. А так же качественная генерация изображений или речи звучащей не как робот. Когда то никто не верил, что машины научатся играть в Go. Ну вы поняли.

Метафора из Life 3.0 Тегмарка. Типа компьютеры планомерно учатся делать все более сложные задачи. И со временем недоступных задач становится все меньше. Как вода заполняет карту снизу вверх.

Ilya Sutskever, когда он еще был в OpenAI, часто упоминал ^[6]внутренний мем – Feel the AGI.

Он одним из первых поверил, что глубинное обучение это технология которая постепенно изменит нашу жизнь. Да, мы многое не знаем, но пока всё движется куда то в ту сторону и это важно. Каждому это понимание приходит в свой момент. Когда нейронка делает что то, что ты считал до этого не возможным. Тебя накрывает и всё, ты теперь безумный ИИ-бро.

Я уже сбился со счета, сколько у меня таких моментов было за 10 лет интереса ^[7] к нейросетям. Так что мне не интересно обсуждать, пузырь это или нет. Мне интересно смотреть как поднимается уровень воды из метафоры на картинке выше.

У нас достаточно доказательств, что агенты теперь могут могут делать ценную работу, за которую компании готовы платить.

И прикол в том, что спросу есть куда расти. Агенты часто не работают прямо из коробки. Под них нужно подстраиваться, что лучше всего получается у самых быстрых и любопытных. Но к ним потихньку подтянутся все остальные.

И …

Индустрия не готова к такому росту

Чтобы не писать про абстрактную индустрию, поделю ее на 3 слоя.

ИИ лаборатории делают модели. OpenAI, Anthropic, DeepMind.
Гиперскейлеры строят датацентры. Google, Amazon, Microsoft, Meta.
Производители чипов производят чипы. Nvidia, TSMC, ASML.

И на всех слоях компании боятся.

Люди в интернете любят поговорить про пузыри. Так вот все эти компании внезапно в курсе, что пузыри случаются. И чтобы не обанкротиться, каждый изобраетает свои способы.

Dario Amodei говорит ^[8], что планы компании он строит из негативного сценария по выручке. Забавно, что в этом году они его уже в полтора раза превышают. А от года всего 3 месяца прошло. Позитивный сценарий правда тоже превышают.

Дваркеш на интервью прямо спросил, как так. Ведь Дарио верит в невероятную пользу от ИИ в будущем. Пишет про это большие эссе, питчит про “страну гениев внутри датацентра”. И при этом не хочет закладывать бабки по максимуму в это самое будущее.

Дарио говорит, что это опасно из за кассового разрыва в бизнес модели.

То есть, они предоставляют юзерам нейронки. Платят за инференс владешьцам железа и получают деньги с подписок и API. А параллельно с этим инвестируют бабки в ресерч на создание модели следующего поколения. Зарабатывать с которой начнут только через год или два.

*Они регулярно тратят на ресерч больше половины.*

Ты балансируешь не просто доходы с расходами, но еще и инвестиции в будущий рост. И если сильно вложился, а роста не случилось – у тебя огромные проблемы.

В таком режиме Антропики живут уже три года подряд. Каждый год растут в 10 раз. Дарио предполагал, что в 2026 это закончится. Ведь чем ты больше, тем сложнее.

Про что он в интерью не говорил, это про то, что их маржинальность растёт медленнее, чем должна по прогнозу ^[9]. Расходы растут в разы быстрее того, что они закладывали в свои планы.

Дарио говорит, что он хочет вывести компанию в зону прибыльности через несколько лет. Для этого нужно улучшить маржинальность. То есть, замедлить рост и консервативно инвестировать деньги только на самые эффективные штуки.

Логика складная. А вот замедлиться чего то не выходит. Как будто они в этом году готовы снова в 10 раз вырасти. Но ресурсов под это не заложено.

Антропикам не хватает мощностей для такого количества пользователей.

Они арендуют видеокарты у гиперскейлеров. И не могут просто прийти в датацентр и попросить больше. Потому что у владельца датацентра тоже есть риск подорваться на пузыре. Поэтому все обьемы расписаны заранее.

Чтобы Anthropic смогли заработать $30B в год, кому то пришлось потратить $80B на инфстуктуру. С расчётом, что все это окупится за несколько лет.

Amazon в этом году потратит примерно $200B, Google $180B, Meta $125B, Microsoft $105B. Это задел на триллионы экономической ценности в ближайшие годы.

И риск кассового разрыва, если ценности не случится.

Индустрия – это длиннющая цепочка создания ценности. И каждый в ней старается снизить для себя риски, фиксируя ожидания в контрактах. Что снижает способность всей цепочки реагировать ^[10] на неожиданности. Такие как, например, рост популярности агентов.

Это приводит к тому, что каждый год лабортории ограничены чем то новым. И ограничения потихоньку сьезжают к тем, кто дальше в цепочке от конечного юзера. Потому что их риски больше, а контракты еще менее гибкие.

Ограничения постоянно разные

В 2023 все гонялись за видеокартами. А точнее у заводов TSMC не хватало мощностей для финальной сборки чипов в модули (CoWoS). В 2024 случился дефицит HBM памяти ^[11] для тех же модулей. В 2025 с картами стало лучше, но для датацентров начало не хватать энергии. В 2026 стало понятно, что даже если энергия есть, электрическая сеть США не может ее доставлять в нужных обьемах до датацентров.

Дальше подробнее.

1 – Память

Свременным моделям память нужна больше, чем раньше. Я выше писал, что компании тратят сотни миллиардов в год на инфраструктуру. По прикидкам примерно 30% из них – это на память.

Причем им приходится закупать дорогую HBM вместо дешевой DDR. Потому что высокая пропускная способность помогает видеокартам не простаивать пока память обрабатывает свою часть. Дорогая память не такая уж и дорогая в сравнении ^[12] с полной стоимостью видеокарты.

Оказывается память это самое дорогое что есть в карте. Если не считать наценку=) — *Оказывается память это самое дорогое что есть в карте. Если не считать наценку =)*

Скорее всего цены на память будут расти, если не придумают как это обходить. Могут спокойно еще в 2-3 раза вырасти, потому что SK Hynix и Samsung контролируют 90% рынка. А спрос на память только растёт.

2 – Энергия и датацентры

xAI показали ^[13], что датацентры можно строить довольно быстро.

Но большая инфраструктура не выдерживает, когда в каком нибудь регионе за полгода появляется штука жрущая электричество как небольшой город. Я уже привык к новостям, что технологические компании начали закупать старые электростанции.

Удивительно, что челик из Semianalysis ^[14] за энергию особо не беспокоится. Новые электростанции, трансформаторные и банально вышки для проводов строить долго. Но пока электическая сеть адаптируется к новой нагрузке, питать датацентры можно от промышленных турбин на газу. Буквально подвозишь к датацентру десяток трейлеров с генераторами и всё.

Еще есть всякие поршневые двигатели, солнечные панели и батареи, химические реакторы на водороде, судовые двигаетли… Короче, что только не придумали за время существвни топливной индустрии. И в совокупности вместе с эффективным использованием электросети это может дать сотни гигаватт мощностей.

Сейчас одни только видеокарты расходуют 13ГВ, если добавить мощности всего датацентра, можно на 2 умножать — *Сейчас одни только видеокарты* *расходуют* ^[15] *13ГВ, если добавить мощности всего датацентра, можно на 2 умножать*

Чтобы строить дата-центры и реакторы быстро, не хватает квалифицированной рабочей силы и банально электриков.

Дорого и трудоёмко, но оказывается все еще проще, чем цепочка поставок полупродневников.

3 – Производство полупроводников

Есть заводы (в основном TSMC), собирающие видеокарты определённой эры (по чертежам Nvidia или Google). Напрмер, по 3-нанометровому процессу.

Ну и просто не построено достаточно заводов.

Быстро это не исправить, потому что это одни из самых сложных промышленных объектов на планете. Чтобы такой построить, нужно 2-3 года и куча специализированного оборудования и химических штук.

Самое сложное – это литографические машины (EUV scanner). Они нужны ^[16], чтобы отливать чипы на вафельницах. Которые потом соединяют в модули с памятью и получаются видеокарты.

Так вот эти машины стоят ~$350M за штуку. Делает такие только одна компания из Нидерландов – ASML. Где то по 50 машин в год.

Можно прикинуть, что к 2030 году в мире их будет в ~700. Это порядка 200 гигават вычислений на всех. На конец 2025 мы тратили ~27 гигават. Это до бума агентов.

Короче, расти есть куда, но будет постоянный дефицит, ограниченный строительством заводов, ограниченный памятью и вафельницами, ограниченный машинами для литографии.

То есть это такие ограничения, которые нельзя залить деньгами в отличие от памяти и энергии для датацентров.

Это хорошо видно на поведении ^[17] Google.

У них есть свой дизайн чипов. И при этом они четверть чипов закупают ^[18] у Nvidia. Они бы с кайфом свои делали, вот только не могут.

*Доля снижается, но это все равно много, с учетом того, что их собственные чипы лучше!*

Все чипы собирают заводы TSMC по чужим чертежам. А Google и Amazon (у них тоже есть свой дизайн) проспали момент когда Jensen Huang назаключал контрактов на производство аж на 70% мощностей 3-нм заводов. TSMC это супер выгодно, потому что они в конце производственной цепочки и им нужна стабильность.

Nvidia тоже кайфует, продавая карты в 6 раз дороже себестоимости.

А гугл еще и своих мощностей Антропикам через GCP напродавал. Удивительная компания.

И чо?

Короче, индустрия не готова к росту от агентов. Потому что он случился слишком внезапно.

На рынке, где в конечном счёте важны долгосрочные контракты на сложную инфраструктуру для создания чипов.

У Антропиков сейчс есть 2.5 гигавата на вычисления и к концу года нужно 5-6. Столько можно получить только побираясь в категории Other. CoreWeave, Bedrock, Vertex, Foundry. С миру по нитке и за очень дорого. А они хотят стать прибыльной компанией и не могут позволить себе транжирить деньги.

Поэтому грустное.

Скорее всего страдать будем мы с вами.

Самое очевидное решение – они просто срежут лимиты и поднимут цены.

На днях они перевели OpenClaw на API. И так и написали, сорян ребята. Затягиваем пояса, вот вам 20 баксов в подарок за беспокойство.

А еще ввели разные тарифы в зависимости от времени суток. Я уже пару раз сталкивался с тем, что в “непиковые” часы Клод ложился под нагрузкой от наплыва бедняков за дешевыми токенами.

Я для себя два вывода сделал.

1 – Не класть все яйца в одну корзину.

Например, создавая скилл делать так, чтобы он работал на любой модели. Я тащусь от Клода, но OpenAI и Google в намного лучшем полжении в плане дступа к компьюту.

Поэтому я научился менять модель в зависимости от задачи. Плачу минимальную подписку каждой лабе. А когда заканчивается лимит – просто меняю нейронки.

Китайским опенсорсом пока не пользуюсь, потому что зачем. Не юзайте Дипсик, ради всего святого.

2 – Нервничать, что я не зарабатываю на ИИ.

Нейронки для меня это не способ зарабатывать больше денег. Это моя статья расходов, которая себя окупает давая больше возможностей и времени.

Но вот если введут какой нибудь тир за 1000 баксов, я такое не потяну. Сейчас это абсурдно звучит. Но вспомните пример из первой части статьи с зарплатой реального человека. Пока 1000 баксов затрат приносит 5000 прибыли – это круто.

И те кто так делать не умеет, будет сидеть в бесплатном тарифе и смотреть рекламу =/

Текст написан без нейросетей, так что сорян за ошибки ^[19] и корявый слог.

Если понравилось, подписывайтесь на мой канал Трагедия Общин ^[20]. Пишу про самое интересное вокруг современных технологий. Похожее на то, что в этом посте, но покороче и почаще.

Автор: leonartamonov

Источник ^[21]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/29233

URLs in this post:

[1] Твит от Андрея Карпати: https://x.com/karpathy/status/2026731645169185220

[2] постят: https://epoch.ai/data/ai-companies/

[3] выросло: https://newsletter.semianalysis.com/p/claude-code-is-the-inflection-point

[4] логике: http://www.braintools.ru/article/7640

[5] обучении: http://www.braintools.ru/article/5125

[6] упоминал : https://news.ycombinator.com/item?id=38341399

[7] интереса: http://www.braintools.ru/article/4220

[8] говорит: https://www.youtube.com/watch?v=n1E9IZfvGMA

[9] должна по прогнозу: https://www.theinformation.com/articles/anthropic-hikes-2026-revenue-forecast-20-delays-will-go-cash-flow-positive

[10] реагировать: http://www.braintools.ru/article/1549

[11] памяти: http://www.braintools.ru/article/4140

[12] в сравнении: https://siliconanalysts.com/guide/semiconductor-costs

[13] показали: https://vas3k.club/post/28066/

[14] челик из Semianalysis: https://www.youtube.com/watch?v=mDG_Hx3BSUE

[15] расходуют: https://epoch.ai/data/ai-chip-owners?view=graph&tab=power

[16] нужны: https://youtu.be/bor0qLifjz4?si=6BMF-81456Rnt_Vp

[17] поведении: http://www.braintools.ru/article/9372

[18] закупают: https://epoch.ai/data/ai-chip-owners

[19] ошибки: http://www.braintools.ru/article/4192

[20] Трагедия Общин: https://t.me/CommonsTragedy

[21] Источник: https://habr.com/ru/articles/1026634/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1026634

Нажмите здесь для печати.