- BrainTools - https://www.braintools.ru -

Институт Аллена (Ai2) опубликовал полный исходный код семейства моделей Molmo 2, которые специализируются на анализе видео и изображений. Модели показывают передовые результаты в трекинге объектов, подсчете и покадровом логическом выводе.
Теперь разработчики могут самостоятельно обучать Molmo 2 на собственных данных и разворачивать её в своих системах. Репозиторий включает полный набор инфраструктурных инструментов: скрипты для претрейна и файнтюнинга, поддержку распределённого обучения [1] на нескольких узлах, утилиты для подготовки данных и оценки качества.
Для деплоя доступны конвертер чекпоинтов в стандартный формат Hugging Face, примеры инференса через transformers и vLLM, легковесная утилита для офлайн-обработки графики, готовый Docker-образ и Gradio-демо.
Открытый доступ к Molmo 2 позволяет исследователям и компаниям интегрировать высокоуровневый анализ видео и изображений без необходимости создавать инфраструктуру с нуля. Это ускоряет внедрение компьютерного зрения [2] в промышленные и научные проекты.
Делегируйте часть рутинных задач вместе с BotHub! [3] Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке [4] вы можете получить 300 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Автор: cognitronn
Источник [5]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/26580
URLs in this post:
[1] обучения: http://www.braintools.ru/article/5125
[2] зрения: http://www.braintools.ru/article/6238
[3] BotHub!: https://bothub.chat/?utm_source=contentmarketing&utm_medium=habr&utm_campaign=news&utm_content=WHO_WRITES_TACTICAL_CODE_FOR_RTS_BETTER_GROK_4_1_FAST_OUTPERFORMED_GEMINI_SPENDING_37_TIMES_LESS
[4] По ссылке: https://bothub.chat/?invitedBy=iTNi-351UcHgc1BxGFWim
[5] Источник: https://habr.com/ru/companies/bothub/news/1006356/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1006356
Нажмите здесь для печати.