
Компании всё чаще сталкиваются с неожиданной стороной внедрения ИИ: экономия на людях не всегда означает снижение расходов. В ряде команд затраты на вычисления, API и токены уже становятся сопоставимы с зарплатным фондом или даже превышают его.
На это обратил внимание Axios со ссылкой на оценки участников рынка. Один из ключевых факторов — рост расходов на вычислительные мощности. Вице-президент Nvidia по прикладному глубокому обучению Брайан Катандзаро отметил, что в некоторых командах стоимость вычислений уже значительно выше расходов на персонал.
Отдельная проблема — инструменты для программирования на базе больших языковых моделей. По данным Axios, технический директор Uber исчерпал годовой бюджет на ИИ уже в начале 2026 года. Значительная часть расходов пришлась не на найм и не на покупку оборудования, а на оплату токенов при работе с Claude Code от Anthropic.
Это хорошо показывает новый риск для компаний: ИИ-инструменты легко масштабируются, но вместе с пользой масштабируются и счета. Если раньше внедрение ИИ часто продавалось как способ снизить издержки, теперь бизнесу приходится считать не только эффект от автоматизации, но и стоимость каждого запроса, агента, пайплайна и эксперимента.
На этом фоне в компаниях постепенно появляется отдельная дисциплина — AI FinOps. Её задача — контролировать стоимость инференса, токенов, облачных мощностей и внутренних ИИ-сервисов. Для бизнеса это становится таким же практическим вопросом, как когда-то контроль расходов на облака: кто и сколько потребляет, какие модели используются, где можно перейти на более дешёвую архитектуру, а где экономия ухудшит качество.
Проблема касается не только стартапов. Крупные технологические компании тоже сталкиваются с давлением на бюджеты. Расходы на дата-центры, GPU, облака и обучение моделей растут быстрее, чем многие ожидали. Поэтому публичным компаниям всё чаще приходится объяснять инвесторам, где именно ИИ даёт измеримый эффект: ускоряет разработку, снижает стоимость поддержки, увеличивает продажи или повышает производительность команд.
Для разработчиков и ИТ-команд это означает более прагматичный подход к ИИ. Недостаточно просто подключить дорогую модель к продукту или внутреннему процессу. Нужно заранее понимать стоимость сценария: сколько токенов тратится на одну операцию, как часто она вызывается, можно ли кэшировать ответы, где нужна флагманская модель, а где достаточно более дешёвой.
Иными словами, рынок постепенно выходит из стадии «добавим ИИ везде» и переходит к вопросу «сколько это стоит и окупается ли». В этом смысле главной проблемой внедрения ИИ может стать не качество моделей, а экономика их ежедневного использования.
Автор: story_book


