- BrainTools - https://www.braintools.ru -
Я внедрял всё это, и мы договорились, что можно использовать статистику по обезличенным логам. Это прямые подсчёты транзакций. Не прогнозы аналитиков, не презентации вендоров — а конкретные реальные логи.
Компания решила возглавить безобразие и дать всем сотрудникам внятный сервис, попробовать все модели рынка и вообще посмотреть, что это даст на практике в приросте производительности и так далее.
Они выбирали между подпиской и моделью с оплатой за токены, и, к счастью, выбрали второе.
Потому что в среднем пользователь использует LLM далеко не так, как может показаться. Если что, крупные модели показывают пользователей, но тщательно скрывают количество запросов и трафик. Потому что его там крайне мало.
Якоб Нильсен проводил исследование [1], что только 20% населения могут нормально сформулировать промпт. Пробуют пару раз и уходят.
Короче, за 7 месяцев с июня по декабрь 2025:
416 пользователей из 527 хоть раз потыкались
122346 запросов (в среднем 42 запроса на пользователя в месяц)
6851 доллар расходов (535 тысяч рублей, 184 руб/месяц на активного юзера)
Если бы они брали 20-долларовые подписки GPT, то получили бы то же самое в 8,5 раз дороже.
При этом мы внедряли агрегатор нейросетей, и там были картинки. 64% бюджета — генерация картинок.
Если только LLM, включая SOTA-модели вроде Gemini 3 Pro Preview, последние GPT, Gemini, последние Антропики — то было бы всего 62 рубля в месяц на пользователя.
Те, кто понял, зачем ему модель, возвращался постоянно.
В общем, заходите, расскажу, что реальные люди, если не бить их палкой, в реальном мире делают с LLM. На практике.
Иногда вы это знаете, иногда нет, но 50-60% ваших сотрудников [2] уже используют нейросети в работе. Ежедневно. Вопрос не в том, внедрять ли. Вопрос в том, контролируете вы это или нет. 71% офисных работников [3] используют AI без одобрения IT. 38% делятся [4] конфиденциальными данными компании с публичными AI-сервисами.
Да, они сольют все ваши данные в OpenAI. Им же хуже!
Запретить AI невозможно (46% сотрудников продолжат [5] использовать даже при явном запрете). Единственный способ контролировать — дать официальный доступ и мониторить.
Вот тут и решили возглавить безобразие.
Если хочется покрутить данные самостоятельно — есть страница с интерактивными графиками [6]. 16 визуализаций, от почасовой активности до кривой Парето. Можно залипнуть.
85% компаний ошибаются [8] в прогнозах расходов на AI больше чем на 10%. Обычно в большую сторону.
Три главные причины:
1. ChatGPT Plus стоит $20 в месяц на человека. На 400 сотрудников — $8 000/мес, $96 000/год. Этот клиент работает через API. На человека выходит $2.35/мес. Разница — в 8,5 раз. Почему? Подписка — это all-you-can-eat буфет. Платишь за возможность есть бесконечно, даже если съедаешь одну тарелку. API — платишь за каждую тарелку отдельно. Если сотрудник делает 50 запросов в месяц — платишь за 50. Если 500 — за 500. При каком объёме подписка выгоднее? При 53 миллионах токенов в месяц [9] на человека для GPT-4o-mini. Это примерно 40 000 страниц текста. В месяц. На одного сотрудника. Реалистично? Нет. Разве что у корректора или технического переводчика — но им-то как раз нужны не mini-модели.
2. Треть запросов съедает две трети бюджета. Генерация картинок дороже текста в 3,5 раза. 74% сотрудников хотя бы раз генерировали картинки — 308 из 416. Это не «отдел дизайна». Это почти все. Включая бухгалтерию. Зачем бухгалтерии картинки — отдельный вопрос. По McKinsey [2], только 35% организаций используют AI для картинок. Наши 74% — вдвое выше рынка. Люди распробовали. Если думаете, что картинки — нишевая функция для дизайнеров, вы ошибаетесь.
GPT Image стоит $0.44 за запрос [10]. Gemini Image — $0.053. Разница в 8 раз. Midjourney — $0.16. В сентябре компания перешла с GPT Image на Gemini. Тихо, без фанфар. Миграция заняла день. 30 599 запросов через Gemini за 4 месяца. Если бы остались на GPT — заплатили бы $13 558. Заплатили $1 621. Экономия: $11 936.
Средний чек на пользователя в сентябре: $6.47. В октябре: $3.67. Упал вдвое за месяц. Люди генерировали столько же картинок — просто каждая стала в 8 раз дешевле.
Качество для бизнес-задач сравнимо [11]. GPT иногда лучше для текста в картинках, но это редко нужно. Если в команде много людей — закладывайте картинки. И сразу выбирайте дешёвого провайдера.
3. 20% пользователей генерируют 79,4% расходов. Парето работает с точностью до процента. Топ-10 пользователей (2,4% от всех) потратили $1 910 — 20% всего бюджета. Лидер — условный «Лазурный Дрозд» — $308 за 7 месяцев, 3 578 запросов. При этом «Мятный Барсук» сделал 2 757 запросов, но потратил $139. Потому что один генерирует картинки, другой — текст.
95% AI-пилотов не дают измеримого влияния на P&L [12] — MIT, 2025. 42% компаний отказались [13] от большинства AI-инициатив в 2025 году. Почему? Потому что считают стоимость внедрения, а не стоимость использования. Покупают enterprise-подписки на всех, хотя активно пользуются 20%.
Правильный расчёт: API + мониторинг + обучение [14]. Не «сколько стоит лицензия», а «сколько стоит запрос».
В этом случае retention 85%. Кто попробовал AI — не бросает.
Это значит: если дать доступ 100 сотрудникам, через полгода активных будет не 20, а 60-80. Бюджет вырастет. Не потому что стало дороже — потому что распробовали.
Это хорошо для бизнеса. Плохо для тех, кто не заложил рост.
Бухгалтеры, PM-ы, аналитики — все работают с таблицами. Логичное ожидание: загружу Excel в AI, получу анализ.
Реальность: человек пихает файл на миллион строк в чат. Ничего не работает. Человек злится.
Почему? Обычный чат-интерфейс не умеет работать с таблицами. Для этого нужны агенты с code interpreter — они запускают Python, обрабатывают данные в изолированном окружении. Это другой продукт, другая цена, другие ограничения.
Хуже того: некоторые сервисы делают вид, что анализируют таблицу. На самом деле берут первые 100 строк и галлюцинируют выводы на их основе. Пользователь получает уверенный бред.
Что делать: объяснять ограничения на старте. AI — не замена Excel. Пока. Кроме Gemini и реально не очень больших таблиц. И подвижки уже идут.
Бухгалтерию в OpenAI и другие агрегаторы они почти слили, конечно. Но есть нюанс — для обучения она не используется, потому что есть правило, про него ниже.
GPT Image позволяет выбрать качество и количество картинок за раз. Что выбирают люди? Максимальное качество. Четыре картинки сразу. Потому что «а вдруг пригодится».
Математика [15]: 4 картинки x $0.25 = $1 за один запрос. Человек делает 15-20 итераций, пока не получит то, что хочет. Итого: $15-20 на одну задачу. Когда это увидели в логах — объяснили людям, как работает ценообразование. Ограничили доступ к картинкам тем, кому они не нужны для работы. Проблема исчезла.
Бонус: вышла Gemini Image, которая стоит в 8 раз дешевле при сравнимом качестве.
Если дать сотруднику доступ ко всем моделям — он будет использовать самую дорогую. Для любой задачи. Даже для «напиши письмо клиенту».
GPT-5 Mini стоит в 6 раз дешевле GPT-5. Gemini Flash — в 7 раз дешевле Pro.
Сколько запросов через дешёвые модели? 4 875 из 123 458. 4 (четыре!) процента.
Почему? Status quo bias [16]. Люди не переключают то, что работает. Даже если рядом лежит то же самое за копейки.
95% предприятий переплачивают [17] за AI. Это не статистика — это бизнес-модель OpenAI.
Решение: сделайте дешёвую модель дефолтом. Дорогую — по запросу. Не всем нужен Claude Sonnet 4.5 или GPT-5.2. Для большинства задач хватает GPT-5 Mini или Gemini Flash.
AI экономит 2-5 часов в неделю [18] на сотрудника — Federal Reserve, BCG, Adecco. Power users [19] экономят 9-20 часов.
Если применить эти данные к нашему случаю:
400 активных сотрудников x 3 часа/неделю x 4 недели = 4 800 часов/месяц
Средняя зарплата 80 000 руб/мес = ~460 руб/час
Экономия: 4 800 x 460 руб = 2.2 млн руб/мес
Расходы на AI: ~77 000 руб/мес
ROI: 2800%. За месяц.
Даже если AI экономит не 3 часа, а 30 минут в неделю — всё равно окупается в 4-5 раз.
Вероятно, оценки завышенные, потому что нет периода адаптации, и они могут использовать экономию для своих собственных задач (отправлять медицинские анализы, советоваться с психологом, просить нарисовать мем для чата), но большая часть задач шла от рабочей роли.
Утекут — точно. Примерно как все ваши гуглодоки.
Будут ли там обработаны — нет, если работаете через API.
С марта 2023 [20] данные, отправленные через API, не используются для обучения моделей OpenAI. По умолчанию. Это касается и Anthropic, и Google.
Важно понимать разницу:
Бесплатный ChatGPT — данные могут использоваться для обучения (можно отключить в настройках)
API — данные не используются для обучения по умолчанию
Логи хранятся до 30 дней для мониторинга злоупотреблений. Enterprise-клиенты могут получить Zero Data Retention — тогда вообще ничего не хранится.
Администратор аккаунта видит логи и может брать за разные места тех, кто использует модель не по назначению. А может и не брать.
Риск есть. Но есть и решения.
В этом случае за 7 месяцев — ни одного критичного простоя.
Один провайдер — это не стратегия, это лотерея. Обычно всё работает. Но бывают дни, когда даже OpenAI выдаёт 90-95% успешных ответов — можете проверить на их странице статуса [21]. Случается не каждый день, но для компании и одного раза достаточно.
Джентльменский набор 2026:
Прямые API: OpenAI, Anthropic, Google (Gemini), xAI (Grok)
Агрегатор: OpenRouter [22] — если один провайдер лежит, трафик идёт через другой
Резерв: Azure OpenAI — те же модели, другая инфраструктура
Как работает: запрос идёт в основной провайдер. Таймаут или ошибка [23] — автоматически переключается на следующий. Пользователь не замечает. Замечает только ваш мониторинг. И вы в три часа ночи.
Про российские модели (YandexGPT, GigaChat): это не fallback. Люди приходят за GPT и Claude. Подменять их на локальные — как заменить BMW на Ладу и сказать «ну едет же».
Нет. Нужен ответственный, но это не full-time работа.
Настроить систему, периодически смотреть логи, отвечать на вопросы — это часть работы одного человека, не отдельная должность.
Full-time понадобится, только если добавить: регулярное обучение новых сотрудников, вебинары с лучшими практиками, обмен опытом [24] между отделами. Но это уже про развитие, не про поддержание.
Не хотите платить за готовые решения — разворачивайте сами. Open source уже не для бородатых энтузиастов с красными глазами.
Три варианта:
Dify [25] (125K звёзд на GitHub) — визуальный конструктор. RAG, агенты, аналитика из коробки. Подключаете свои API-ключи, получаете корпоративный ChatGPT за вечер.
Open WebUI [26] (120K звёзд) — проще некуда. Docker, LDAP-авторизация, работает офлайн. Идеально для параноиков и компаний, где безопасник спит с файрволом под подушкой.
LobeChat [27] (70K звёзд) — самый красивый интерфейс. 42 провайдера моделей, плагины в один клик. Если сотрудники привыкли к ChatGPT — не заметят разницы.
Что нужно: сервер, Docker, API-ключи провайдеров. Время на развёртывание: день-два. Время на допиливание под себя: неделя-месяц. Время на объяснение бухгалтерии, зачем это нужно: вечность.
Хотите российский сервис со всеми закрывашками и т.п. — ну вот я занимаюсь )
Считайте по API, не по подпискам (разница в 5-10 раз)
Закладывайте рост: retention 80%+, активных станет больше
Лучше ставить отдельный бюджет на картинки или отдельные лимиты
Мониторьте топ-20% пользователей — они определяют бюджет
Смотрите на стоимость запроса, не на общую сумму
Давайте официальный доступ — иначе shadow AI
Это ошибка. Мы сделали так:
2 часа записанного видео (промптинг, ограничения, разные модели для разных задач)
2 недели на просмотр в удобное время
Живой вебинар на час с ответами на вопросы
Главный урок: обучение без проверки — это рекомендация, а не знание. Человек всё равно попробует засунуть таблицу на миллион строк, даже если ему сказали не засовывать. Потому что «а вдруг». То же с дорогими моделями и 4 картинками за раз — люди учатся на своих ошибках, а не на чужих видео.
И ещё один урок — не торопиться с запуском. Клиент настоял на неделе тестирования перед раскаткой на всех. Цитата из переписки: «Подключать не готовый сервис — сразу потеряет среди пользователей интерес [28] и репутацию». Корпоративные пользователи не прощают глюков. Один раз не заработало — больше не откроют.
Источник данных: анонимизированные логи запросов к AI-сервису, 122 346 записей
Период: июнь — декабрь 2025 (7 полных месяцев)
Компания: образовательная, ~500 сотрудников (профиль изменён для защиты данных)
Курс: 78.2 руб/$ — ЦБ РФ на 08.01.2026
Средняя зарплата: 80 000 руб/мес — расчёт ФОТ/численность
Данные без января 2026 — новогодние каникулы, неполная неделя, 1 112 запросов от 47 человек. Выбросы искажали бы картину.
AI для 500 человек стоит меньше одной годовой зарплаты. Меньше одной!
85% компаний [8] этого не делают и ошибаются в бюджете на 10%+. 95% AI-пилотов [12] не показывают ROI.
Вот так это выглядит!
Автор: enjoykaz
Источник [29]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/24447
URLs in this post:
[1] исследование: https://www.nngroup.com/articles/ai-articulation-barrier/
[2] 50-60% ваших сотрудников: https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai
[3] 71% офисных работников: https://www.infosecurity-magazine.com/news/shadow-ai-employees-use-unapproved/
[4] 38% делятся: https://www.helpnetsecurity.com/2025/07/11/organizations-shadow-ai-risk/
[5] 46% сотрудников продолжат: https://community.isc2.org/t5/Industry-News/Shadow-AI-on-the-Rise-50-of-Employees-Using-Unapproved-AI-Tools/td-p/79019
[6] страница с интерактивными графиками: https://aiacademy.me/ai-case-2026
[7] Эволюция: http://www.braintools.ru/article/7702
[8] 85% компаний ошибаются: https://www.mavvrik.ai/2025-state-of-ai-cost-management-research-finds-85-of-companies-miss-ai-forecasts-by-10/
[9] При 53 миллионах токенов в месяц: https://prompt.16x.engineer/blog/chatgpt-plus-vs-api-cost
[10] $0.44 за запрос: https://openai.com/api/pricing/
[11] сравнимо: https://beebom.com/chatgpt-vs-gemini-native-image-generation/
[12] 95% AI-пилотов не дают измеримого влияния на P&L: https://fortune.com/2025/08/18/mit-report-95-percent-generative-ai-pilots-at-companies-failing-cfo/
[13] 42% компаний отказались: https://beam.ai/agentic-insights/why-42-of-ai-projects-show-zero-roi-(and-how-to-be-in-the-58-)
[14] обучение: http://www.braintools.ru/article/5125
[15] Математика: http://www.braintools.ru/article/7620
[16] Status quo bias: https://thedecisionlab.com/reference-guide/psychology/defaults
[17] 95% предприятий переплачивают: https://www.mill5.com/2025/11/04/the-hidden-cost-of-ai/
[18] AI экономит 2-5 часов в неделю: https://www.stlouisfed.org/on-the-economy/2025/feb/impact-generative-ai-work-productivity
[19] Power users: https://itif.org/publications/2025/05/09/frequent-generative-ai-users-report-saving-hours-weekly-at-work/
[20] С марта 2023: https://openai.com/enterprise-privacy/
[21] странице статуса: https://status.openai.com/
[22] OpenRouter: https://openrouter.ai/
[23] ошибка: http://www.braintools.ru/article/4192
[24] опытом: http://www.braintools.ru/article/6952
[25] Dify: https://github.com/langgenius/dify
[26] Open WebUI: https://github.com/open-webui/open-webui
[27] LobeChat: https://github.com/lobehub/lobe-chat
[28] интерес: http://www.braintools.ru/article/4220
[29] Источник: https://habr.com/ru/articles/986346/?utm_source=habrahabr&utm_medium=rss&utm_campaign=986346
Нажмите здесь для печати.