- BrainTools - https://www.braintools.ru -
Компания VK начала [1]внедрять в поиск своих продуктов визуально‑языковые модели (VLM). VLM) представляют собой искусственный интеллект [2], который одновременно анализирует текст, изображения, звук и видеоряд. Технология уже работает в «VK Видео». Она появится в других сервисах компании, где есть поисковые системы.

Модель учитывает название и описание загруженного на платформу контента. Она также анализирует его смысл. Это позволяет точнее отвечать на поисковые запросы пользователей. Новая разработка от инженеров AI VK автоматически формирует датасеты. Эти данные о контенте помогают поисковым алгоритмам определять, какое видео подходит к запросу, а какое нет.
С запуском модели в будущем улучшится векторный поиск в продуктах VK. Он основан на семантическом значении запроса. Система будет понимать, что пользователь чаще выбирает видео с определённым стилем монтажа и цветокоррекции. Модель точнее распознает гибридные запросы, где текст и визуальные характеристики комбинируются.
Поисковая выдача станет более персонализированной. Как рассказали в VK, внедрение визуально‑языковых моделей ускорит в пять раз разработку и масштабирование новых технологий. Это поможет развитию и улучшению поиска во всех продуктах VK.
Автор: Lexx_Nimofff
Источник [3]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/26027
URLs in this post:
[1] начала : https://vk.company/ru/press/releases/12230/
[2] интеллект: http://www.braintools.ru/article/7605
[3] Источник: https://habr.com/ru/news/1002282/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1002282
Нажмите здесь для печати.