- BrainTools - https://www.braintools.ru -

Google выпустила TranslateGemma, новую открытую модель машинного перевода на базе Gemma 3. Внутри используется дообучение на синтетических данных от флагманской Gemini с последующей полировкой через reinforcement learning. Компания продолжает стратегию «тихих» сайд-релизов, выкладывая мощные инструменты без громких презентаций.
Так как основой стала Gemma 3, модель умеет работать с текстом прямо на изображениях. OCR и перевод встроены «из коробки», без внешних пайплайнов и дополнительных модулей. Это делает TranslateGemma удобным инструментом для задач вроде перевода скриншотов, документов и фото с текстом.
Google заявляет гарантированное качество на 55 языках, но также отмечает, что модель видела данные еще по примерно 500 языкам. На практике это означает, что на редких диалектах возможны заметные галлюцинации и ошибки [1], однако даже такой охват выглядит впечатляюще для открытой модели.
Линейка включает три версии: 4B, 12B и 27B параметров. В официальных бенчмарках Google показывает, что версия на 12B превосходит базовую Gemma 3 на 27B именно в задачах перевода. При этом компания в основном сравнивает новинку с собственными моделями, а не с классическими специализированными решениями вроде NLLB, поэтому реальное положение TranslateGemma на рынке еще предстоит оценить.
Веса уже доступны на Hugging Face [2] и Kaggle [3]. Версия на 12B выглядит как «золотая середина» по соотношению качества и ресурсов, но для максимального уровня перевода старшая модель все равно потребует железо уровня H100.
Делегируйте часть рутинных задач вместе с BotHub! [4] Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке [5] вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Источник [6]
Автор: cognitronn
Источник [7]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/24388
URLs in this post:
[1] ошибки: http://www.braintools.ru/article/4192
[2] Hugging Face: https://huggingface.co/collections/google/translategemma
[3] Kaggle: https://www.kaggle.com/models/google/translategemma/
[4] BotHub!: https://bothub.chat/?utm_source=contentmarketing&utm_medium=habr&utm_campaign=news&utm_content=ELON_MUSK_PROMISED_TO_OPEN_ACCES_TO_THE_SOURCE_CODE_OF_THE_NEW_ALGORITHM_X_IN_SEVEN_DAYS
[5] По ссылке: https://bothub.chat/?invitedBy=m_aGCkuyTgqllHCK0dUc7
[6] Источник: https://arxiv.org/pdf/2601.09012
[7] Источник: https://habr.com/ru/companies/bothub/news/985946/?utm_source=habrahabr&utm_medium=rss&utm_campaign=985946
Нажмите здесь для печати.