Я внедрял всё это, и мы договорились, что можно использовать статистику по обезличенным логам. Это прямые подсчёты транзакций. Не прогнозы аналитиков, не презентации вендоров — а конкретные реальные логи.
Компания решила возглавить безобразие и дать всем сотрудникам внятный сервис, попробовать все модели рынка и вообще посмотреть, что это даст на практике в приросте производительности и так далее.
Они выбирали между подпиской и моделью с оплатой за токены, и, к счастью, выбрали второе.
Потому что в среднем пользователь использует LLM далеко не так, как может показаться. Если что, крупные модели показывают пользователей, но тщательно скрывают количество запросов и трафик. Потому что его там крайне мало.
Якоб Нильсен проводил исследование, что только 20% населения могут нормально сформулировать промпт. Пробуют пару раз и уходят.
Короче, за 7 месяцев с июня по декабрь 2025:
-
416 пользователей из 527 хоть раз потыкались
-
122346 запросов (в среднем 42 запроса на пользователя в месяц)
-
6851 доллар расходов (535 тысяч рублей, 184 руб/месяц на активного юзера)
-
Если бы они брали 20-долларовые подписки GPT, то получили бы то же самое в 8,5 раз дороже.
При этом мы внедряли агрегатор нейросетей, и там были картинки. 64% бюджета — генерация картинок.
Если только LLM, включая SOTA-модели вроде Gemini 3 Pro Preview, последние GPT, Gemini, последние Антропики — то было бы всего 62 рубля в месяц на пользователя.
Те, кто понял, зачем ему модель, возвращался постоянно.
В общем, заходите, расскажу, что реальные люди, если не бить их палкой, в реальном мире делают с LLM. На практике.
AI у вас уже внедрён
Иногда вы это знаете, иногда нет, но 50-60% ваших сотрудников уже используют нейросети в работе. Ежедневно. Вопрос не в том, внедрять ли. Вопрос в том, контролируете вы это или нет. 71% офисных работников используют AI без одобрения IT. 38% делятся конфиденциальными данными компании с публичными AI-сервисами.
Да, они сольют все ваши данные в OpenAI. Им же хуже!
Запретить AI невозможно (46% сотрудников продолжат использовать даже при явном запрете). Единственный способ контролировать — дать официальный доступ и мониторить.
Вот тут и решили возглавить безобразие.
Основные результаты нашего 7-месячного опыта
Если хочется покрутить данные самостоятельно — есть страница с интерактивными графиками. 16 визуализаций, от почасовой активности до кривой Парето. Можно залипнуть.
Откуда 62 рубля в месяц на пользователя или 184 рубля в месяц?
85% компаний ошибаются в прогнозах расходов на AI больше чем на 10%. Обычно в большую сторону.
Три главные причины:
1. ChatGPT Plus стоит $20 в месяц на человека. На 400 сотрудников — $8 000/мес, $96 000/год. Этот клиент работает через API. На человека выходит $2.35/мес. Разница — в 8,5 раз. Почему? Подписка — это all-you-can-eat буфет. Платишь за возможность есть бесконечно, даже если съедаешь одну тарелку. API — платишь за каждую тарелку отдельно. Если сотрудник делает 50 запросов в месяц — платишь за 50. Если 500 — за 500. При каком объёме подписка выгоднее? При 53 миллионах токенов в месяц на человека для GPT-4o-mini. Это примерно 40 000 страниц текста. В месяц. На одного сотрудника. Реалистично? Нет. Разве что у корректора или технического переводчика — но им-то как раз нужны не mini-модели.
2. Треть запросов съедает две трети бюджета. Генерация картинок дороже текста в 3,5 раза. 74% сотрудников хотя бы раз генерировали картинки — 308 из 416. Это не «отдел дизайна». Это почти все. Включая бухгалтерию. Зачем бухгалтерии картинки — отдельный вопрос. По McKinsey, только 35% организаций используют AI для картинок. Наши 74% — вдвое выше рынка. Люди распробовали. Если думаете, что картинки — нишевая функция для дизайнеров, вы ошибаетесь.
GPT Image стоит $0.44 за запрос. Gemini Image — $0.053. Разница в 8 раз. Midjourney — $0.16. В сентябре компания перешла с GPT Image на Gemini. Тихо, без фанфар. Миграция заняла день. 30 599 запросов через Gemini за 4 месяца. Если бы остались на GPT — заплатили бы $13 558. Заплатили $1 621. Экономия: $11 936.
Средний чек на пользователя в сентябре: $6.47. В октябре: $3.67. Упал вдвое за месяц. Люди генерировали столько же картинок — просто каждая стала в 8 раз дешевле.
Качество для бизнес-задач сравнимо. GPT иногда лучше для текста в картинках, но это редко нужно. Если в команде много людей — закладывайте картинки. И сразу выбирайте дешёвого провайдера.
3. 20% пользователей генерируют 79,4% расходов. Парето работает с точностью до процента. Топ-10 пользователей (2,4% от всех) потратили $1 910 — 20% всего бюджета. Лидер — условный «Лазурный Дрозд» — $308 за 7 месяцев, 3 578 запросов. При этом «Мятный Барсук» сделал 2 757 запросов, но потратил $139. Потому что один генерирует картинки, другой — текст.
Все считают неправильно, всё дешевле в 5 раз
95% AI-пилотов не дают измеримого влияния на P&L — MIT, 2025. 42% компаний отказались от большинства AI-инициатив в 2025 году. Почему? Потому что считают стоимость внедрения, а не стоимость использования. Покупают enterprise-подписки на всех, хотя активно пользуются 20%.
Правильный расчёт: API + мониторинг + обучение. Не «сколько стоит лицензия», а «сколько стоит запрос».
Кто попробовал — не бросают
В этом случае retention 85%. Кто попробовал AI — не бросает.
Это значит: если дать доступ 100 сотрудникам, через полгода активных будет не 20, а 60-80. Бюджет вырастет. Не потому что стало дороже — потому что распробовали.
Это хорошо для бизнеса. Плохо для тех, кто не заложил рост.
Таблицы — разрыв ожиданий
Бухгалтеры, PM-ы, аналитики — все работают с таблицами. Логичное ожидание: загружу Excel в AI, получу анализ.
Реальность: человек пихает файл на миллион строк в чат. Ничего не работает. Человек злится.
Почему? Обычный чат-интерфейс не умеет работать с таблицами. Для этого нужны агенты с code interpreter — они запускают Python, обрабатывают данные в изолированном окружении. Это другой продукт, другая цена, другие ограничения.
Хуже того: некоторые сервисы делают вид, что анализируют таблицу. На самом деле берут первые 100 строк и галлюцинируют выводы на их основе. Пользователь получает уверенный бред.
Что делать: объяснять ограничения на старте. AI — не замена Excel. Пока. Кроме Gemini и реально не очень больших таблиц. И подвижки уже идут.
Бухгалтерию в OpenAI и другие агрегаторы они почти слили, конечно. Но есть нюанс — для обучения она не используется, потому что есть правило, про него ниже.
Настройки картинок съедают бюджет незаметно
GPT Image позволяет выбрать качество и количество картинок за раз. Что выбирают люди? Максимальное качество. Четыре картинки сразу. Потому что «а вдруг пригодится».
Математика: 4 картинки x $0.25 = $1 за один запрос. Человек делает 15-20 итераций, пока не получит то, что хочет. Итого: $15-20 на одну задачу. Когда это увидели в логах — объяснили людям, как работает ценообразование. Ограничили доступ к картинкам тем, кому они не нужны для работы. Проблема исчезла.
Бонус: вышла Gemini Image, которая стоит в 8 раз дешевле при сравнимом качестве.
Они всегда используют самую дорогую модель для всего
Если дать сотруднику доступ ко всем моделям — он будет использовать самую дорогую. Для любой задачи. Даже для «напиши письмо клиенту».
GPT-5 Mini стоит в 6 раз дешевле GPT-5. Gemini Flash — в 7 раз дешевле Pro.
Сколько запросов через дешёвые модели? 4 875 из 123 458. 4 (четыре!) процента.
Почему? Status quo bias. Люди не переключают то, что работает. Даже если рядом лежит то же самое за копейки.
95% предприятий переплачивают за AI. Это не статистика — это бизнес-модель OpenAI.
Решение: сделайте дешёвую модель дефолтом. Дорогую — по запросу. Не всем нужен Claude Sonnet 4.5 или GPT-5.2. Для большинства задач хватает GPT-5 Mini или Gemini Flash.
А оно вообще окупается?
AI экономит 2-5 часов в неделю на сотрудника — Federal Reserve, BCG, Adecco. Power users экономят 9-20 часов.
Если применить эти данные к нашему случаю:
-
400 активных сотрудников x 3 часа/неделю x 4 недели = 4 800 часов/месяц
-
Средняя зарплата 80 000 руб/мес = ~460 руб/час
-
Экономия: 4 800 x 460 руб = 2.2 млн руб/мес
-
Расходы на AI: ~77 000 руб/мес
ROI: 2800%. За месяц.
Даже если AI экономит не 3 часа, а 30 минут в неделю — всё равно окупается в 4-5 раз.
Вероятно, оценки завышенные, потому что нет периода адаптации, и они могут использовать экономию для своих собственных задач (отправлять медицинские анализы, советоваться с психологом, просить нарисовать мем для чата), но большая часть задач шла от рабочей роли.
А данные точно утекут в OpenAI?
Утекут — точно. Примерно как все ваши гуглодоки.
Будут ли там обработаны — нет, если работаете через API.
С марта 2023 данные, отправленные через API, не используются для обучения моделей OpenAI. По умолчанию. Это касается и Anthropic, и Google.
Важно понимать разницу:
-
Бесплатный ChatGPT — данные могут использоваться для обучения (можно отключить в настройках)
-
API — данные не используются для обучения по умолчанию
Логи хранятся до 30 дней для мониторинга злоупотреблений. Enterprise-клиенты могут получить Zero Data Retention — тогда вообще ничего не хранится.
Администратор аккаунта видит логи и может брать за разные места тех, кто использует модель не по назначению. А может и не брать.
Санкции — всё заблокируют
Риск есть. Но есть и решения.
В этом случае за 7 месяцев — ни одного критичного простоя.
Один провайдер — это не стратегия, это лотерея. Обычно всё работает. Но бывают дни, когда даже OpenAI выдаёт 90-95% успешных ответов — можете проверить на их странице статуса. Случается не каждый день, но для компании и одного раза достаточно.
Джентльменский набор 2026:
-
Прямые API: OpenAI, Anthropic, Google (Gemini), xAI (Grok)
-
Агрегатор: OpenRouter — если один провайдер лежит, трафик идёт через другой
-
Резерв: Azure OpenAI — те же модели, другая инфраструктура
Как работает: запрос идёт в основной провайдер. Таймаут или ошибка — автоматически переключается на следующий. Пользователь не замечает. Замечает только ваш мониторинг. И вы в три часа ночи.
Про российские модели (YandexGPT, GigaChat): это не fallback. Люди приходят за GPT и Claude. Подменять их на локальные — как заменить BMW на Ладу и сказать «ну едет же».
Нужен выделенный человек?
Нет. Нужен ответственный, но это не full-time работа.
Настроить систему, периодически смотреть логи, отвечать на вопросы — это часть работы одного человека, не отдельная должность.
Full-time понадобится, только если добавить: регулярное обучение новых сотрудников, вебинары с лучшими практиками, обмен опытом между отделами. Но это уже про развитие, не про поддержание.
Как развернуть самим
Не хотите платить за готовые решения — разворачивайте сами. Open source уже не для бородатых энтузиастов с красными глазами.
Три варианта:
Dify (125K звёзд на GitHub) — визуальный конструктор. RAG, агенты, аналитика из коробки. Подключаете свои API-ключи, получаете корпоративный ChatGPT за вечер.
Open WebUI (120K звёзд) — проще некуда. Docker, LDAP-авторизация, работает офлайн. Идеально для параноиков и компаний, где безопасник спит с файрволом под подушкой.
LobeChat (70K звёзд) — самый красивый интерфейс. 42 провайдера моделей, плагины в один клик. Если сотрудники привыкли к ChatGPT — не заметят разницы.
Что нужно: сервер, Docker, API-ключи провайдеров. Время на развёртывание: день-два. Время на допиливание под себя: неделя-месяц. Время на объяснение бухгалтерии, зачем это нужно: вечность.
Хотите российский сервис со всеми закрывашками и т.п. — ну вот я занимаюсь )
Важные советы
-
Считайте по API, не по подпискам (разница в 5-10 раз)
-
Закладывайте рост: retention 80%+, активных станет больше
-
Лучше ставить отдельный бюджет на картинки или отдельные лимиты
-
Мониторьте топ-20% пользователей — они определяют бюджет
-
Смотрите на стоимость запроса, не на общую сумму
-
Давайте официальный доступ — иначе shadow AI
58% пользователей не получают никакого тренинга
Это ошибка. Мы сделали так:
-
2 часа записанного видео (промптинг, ограничения, разные модели для разных задач)
-
2 недели на просмотр в удобное время
-
Живой вебинар на час с ответами на вопросы
Главный урок: обучение без проверки — это рекомендация, а не знание. Человек всё равно попробует засунуть таблицу на миллион строк, даже если ему сказали не засовывать. Потому что «а вдруг». То же с дорогими моделями и 4 картинками за раз — люди учатся на своих ошибках, а не на чужих видео.
И ещё один урок — не торопиться с запуском. Клиент настоял на неделе тестирования перед раскаткой на всех. Цитата из переписки: «Подключать не готовый сервис — сразу потеряет среди пользователей интерес и репутацию». Корпоративные пользователи не прощают глюков. Один раз не заработало — больше не откроют.
Методология
-
Источник данных: анонимизированные логи запросов к AI-сервису, 122 346 записей
-
Период: июнь — декабрь 2025 (7 полных месяцев)
-
Компания: образовательная, ~500 сотрудников (профиль изменён для защиты данных)
-
Курс: 78.2 руб/$ — ЦБ РФ на 08.01.2026
-
Средняя зарплата: 80 000 руб/мес — расчёт ФОТ/численность
Данные без января 2026 — новогодние каникулы, неполная неделя, 1 112 запросов от 47 человек. Выбросы искажали бы картину.
Итоги
AI для 500 человек стоит меньше одной годовой зарплаты. Меньше одной!
85% компаний этого не делают и ошибаются в бюджете на 10%+. 95% AI-пилотов не показывают ROI.
Вот так это выглядит!
Автор: enjoykaz


