- BrainTools - https://www.braintools.ru -

Apple выпустила новую линейку FastVLM — это ультраскоростные VL-модели с гибридным энкодером FastViTHD, который уменьшает количество визуальных токенов и ускоряет их обработку.
По сравнению с LLaVA-1.5, FastVLM обеспечивает в 3,2 раза более быстрое время до первого токена (TTFT) при аналогичном уровне качества. А в сопоставлении с LLaVa-OneVision новая модель достигает тех же результатов на бенчмарках, но при этом использует энкодер, который в 3,4 раза меньше.
В семейство входят три модели:
• 500 млн параметров
• 1,5 млрд параметров
• 7 млрд параметров
Все они уже доступны на Hugging Face [1] — правда, пока только для некоммерческого использования.
Делегируйте часть рутинных задач вместе с [2]BotHub [3]! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке [4] вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Автор: cognitronn
Источник [5]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/18917
URLs in this post:
[1] доступны на Hugging Face: https://huggingface.co/collections/apple/fastvlm-68ac97b9cd5cacefdd04872e
[2] : https://bothub.chat/?utm%5C%5C%5C%5C%5C%5C_source=contentmarketing&utm%5C%5C%5C%5C%5C%5C_medium=habr&utm%5C%5C%5C%5C%5C%5C_campaign=news&utm%5C%5C%5C%5C%5C%5C_content=GEMINI%20ON%20CHATGPT%27S%20HEELS:%20THE%20LATEST%20AI%20RANKING%20FROM%20ANDREESSEN%20HOROWITZ
[3] BotHub: https://bothub.chat/?utm_source=contentmarketing&utm_medium=habr&utm_campaign=news&utm_content=3.2%20TIMES%20FASTER%20THAN%20COMPETITORS:%20APPLE%20LAUNCHES%20FASTVLM
[4] По ссылке: https://bothub.chat/?invitedBy=m%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_aGCkuyTgqllHCK0dUc7
[5] Источник: https://habr.com/ru/companies/bothub/news/942302/?utm_source=habrahabr&utm_medium=rss&utm_campaign=942302
Нажмите здесь для печати.