- BrainTools - https://www.braintools.ru -

InternLM представила модели CapRL-3B и CapRL-Eval-3B для генерации текста к изображениям

InternLM представила модели CapRL-3B и CapRL-Eval-3B для генерации текста к изображениям - 1

Команда InternLM анонсировала две новые модели — CapRL-3B и CapRL-Eval-3B [1], предназначенные для создания текстовых подписей к изображениям. По точности работы они сопоставимы с гораздо более крупной моделью Qwen2.5-VL-72B, что делает их особенно интересными для разработчиков, которым нужны мощные, но компактные решения.

InternLM представила модели CapRL-3B и CapRL-Eval-3B для генерации текста к изображениям - 2

Главное преимущество CapRL-моделей — умение качественно обрабатывать сложные визуальные данные. Они особенно хорошо справляются с подписями к диаграммам, инфографике, документам и другим структурированным изображениям, где важны контекст, точность и логичность описания.

Новые модели обучены с применением методов reinforcement learning и системы проверяемых наград, что позволяет генерировать более разнообразные и осмысленные подписи, лучше адаптированные к содержанию изображения. Такой подход даёт моделям возможность не только описывать, но и интерпретировать визуальные объекты, повышая ценность результата для аналитики, образования или автоматической документации.

Важный плюс — лицензия Apache 2.0, которая открывает широкие возможности для коммерческого и исследовательского использования. Это означает, что компании и разработчики могут внедрять CapRL-3B и CapRL-Eval-3B в собственные продукты без сложных ограничений, а также дообучать и адаптировать модели под свои задачи.

Появление таких решений показывает, что компактные модели могут быть не менее мощными, чем гигантские системы, если их правильно обучить. Это делает генерацию подписей к изображениям более доступной, экономичной и удобной для массового применения — от автоматической разметки данных до построения интеллектуальных поисковых систем.


Делегируйте часть рутинных задач вместе с BotHub! [2] Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке [3] вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Автор: cognitronn

Источник [4]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/20122

URLs in this post:

[1] CapRL-3B и CapRL-Eval-3B: https://huggingface.co/internlm/CapRL-3B

[2] BotHub!: https://bothub.chat/?utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_source=contentmarketing&utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_medium=habr&utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_campaign=news&utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_content=A%20NEW%20AGENT%20FROM%20OPENAI%20MAY%20BE%20BASED%20ON%20GPT-5

[3] По ссылке: https://bothub.chat/?invitedBy=m_aGCkuyTgqllHCK0dUc7

[4] Источник: https://habr.com/ru/companies/bothub/news/952036/?utm_source=habrahabr&utm_medium=rss&utm_campaign=952036

www.BrainTools.ru

Rambler's Top100