- BrainTools - https://www.braintools.ru -
При разработке SpamAway (антиспам-бота для Telegram) встал вопрос выбора модели. Бот должен в реальном времени проверять входящие сообщения, классифицировать их и при необходимости удалять. Нагрузка небольшая, но постоянная: 10–15 чатов, до 5000 сообщений в сутки.
Казалось бы, логично [1] использовать отечественные решения: GigaChat или YandexGPT. Они отлично понимают русский сленг, сарказм и специфические “крипто-офферы”. Однако при попытке вписать их в бесплатный тир (freemium) или низкий бюджет начинаются проблемы.
Для классификации сообщения используется промпт с несколькими примерами (few-shot).
Средний размер сообщения: 50–100 токенов.
Промпт с контекстом и правилами: ~500 токенов.
Итого: ~600 токенов на одну проверку.
Цель: найти модель с бесплатным лимитом, достаточным для 1000+ проверок в сутки без задержек.
Сбер предлагает заманчивый Freemium для физических лиц через GigaChat API. По документации это выглядит щедро:
900 000 токенов в год для модели Lite.
50 000 токенов для Pro и Max.
Но есть критическое ограничение: один поток. Это означает, что API обрабатывает строго один запрос в единицу времени. Если в три разных чата одновременно прилетели сообщения, бот будет проверять их в очереди. Для антиспам-фильтра, где важна скорость реакции [2], это неприемлемо.
Математика [3] лимитов тоже расстраивает. 900 000 токенов / 600 на проверку = всего 1500 проверок в год. Это меньше пяти проверок в день. Для живого чата такой лимит исчерпается за полчаса.
У Яндекса ситуация иная. Честного бесплатного тира для API по сути нет. Есть стартовый грант (~4000 рублей на 60 дней) при регистрации в Yandex Cloud.
Цены после гранта:
YandexGPT 5.1 Lite: 20 копеек за 1000 токенов.
YandexGPT 5.1 Pro: 40 копеек за 1000 токенов.
Проверка одного сообщения обойдется в 0,012 рубля. Это дешево, но требует привязки карты, работы с биллингом облака и оплаты в рублях. Для пет-проекта или Open Source инструмента это лишний порог входа.
На этом фоне Google Gemini 2.5 Flash выглядит как “чит-код”. Бесплатный уровень (Free tier) предлагает:
15 запросов в минуту (RPM).
1 миллион токенов в день.
Отсутствие лимита на количество потоков (в рамках RPM).
Даже при 600 токенах на сообщение мы получаем около 1600 проверок в день абсолютно бесплатно. Этого с запасом хватает для SpamAway.
|
Параметр |
GigaChat Free |
YandexGPT (Lite) |
Gemini Flash (Free) |
|---|---|---|---|
|
Бесплатный лимит |
1500 пров./год |
Грант на 60 дней |
~1600 пров./день |
|
Параллельность |
1 поток |
Несколько |
15 RPM |
|
Цена (100K токенов) |
~6.5 руб (пакет) |
20 руб |
$0 |
|
Работа из РФ |
Нативно |
Нативно |
Через прокси/VPN |
Российские нейронки отлично справляются с качеством текста, но их API-политика пока не дружелюбна к маленьким бесплатным проектам. Лимиты Сбера ориентированы скорее на “попробовать один раз”, чем на постоянную работу бота. Яндекс же сразу переводит в коммерческую плоскость Cloud-инфраструктуры.
Gemini Flash — лидер для селф-хостинг решений благодаря огромному бесплатному окну. Главный риск здесь — нестабильность доступа из РФ, что решается поднятием прокси-сервера.
В проекте SpamAway выбор сделан в пользу Gemini. Это позволяет держать бота бесплатным для сообществ, не жертвуя скоростью и качеством фильтраци
Подробнее о настройке и архитектуре антиспам-системы я пишу в своем канале: @popovvii [4].
Автор: StudyQA
Источник [5]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/28186
URLs in this post:
[1] логично: http://www.braintools.ru/article/7640
[2] реакции: http://www.braintools.ru/article/1549
[3] Математика: http://www.braintools.ru/article/7620
[4] @popovvii: https://t.me/popovvii
[5] Источник: https://habr.com/ru/articles/1018674/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1018674
Нажмите здесь для печати.