- BrainTools - https://www.braintools.ru -
Google интегрирует технологию анализа видео в реальном времени в своего помощника Gemini. Об этом компания сообщила на Mobile World Congress.

Google представляет функции искусственного интеллекта для своего помощника Gemini [1] на Всемирном мобильном конгрессе (MWC) в Барселоне. Компания объявила, что подписчики Google One AI Premium для Gemini Advanced получат доступ к функциям потокового видео и демонстрации экрана в конце этого месяца.
В Gemini Live появятся две новые важные функции: во-первых, возможность анализировать видео в реальном времени, а во-вторых, функция демонстрации экрана. С помощью обеих функций пользователи смогут делиться визуальным контентом с ИИ-помощником в режиме реального времени — в случае с видео в реальном времени через изображения с камеры, а в случае с демонстрацией экрана — через экран своего смартфона, чтобы получать комментарии к контенту.
Новые функции изначально доступны только на устройствах Android и поддерживают несколько языков. На MWC компания Google продемонстрирует интеграцию этих функций на устройствах-партнёрах от различных производителей Android.
Добавление визуальных функций — важный шаг в развитии ИИ-помощников, которые, как ожидается, будут всё чаще действовать мультимодально и взаимодействовать с реальным миром.
Цель Google на 2025 год — проект «Astra», универсальный мультимодальный ИИ-помощник, который может обрабатывать текстовые, видео- и аудиоданные в режиме реального времени и сохранять их в контексте диалога до десяти минут. Astra также сможет использовать Google Поиск, Lens и Карты.
Неизвестно, планирует ли Google на самом деле выпустить Astra или, что более вероятно, будут ли функции, представленные для Astra, интегрированы в Gemini.
С помощью Gemini Live Google позиционирует себя как конкурента OpenAI и его ChatGPT: с декабря в расширенном голосовом режиме ChatGPT появилась поддержка трансляции в реальном времени и демонстрации экрана.
Источник [2]
Автор: mefdayy
Источник [3]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/12761
URLs in this post:
[1] представляет функции искусственного интеллекта для своего помощника Gemini: https://blog.google/feed/android-gemini-mobile-world-congress-2025/
[2] Источник: https://the-decoder.com/google-sets-march-release-for-geminis-live-video-and-screen-analysis/
[3] Источник: https://habr.com/ru/companies/bothub/news/887518/?utm_source=habrahabr&utm_medium=rss&utm_campaign=887518
Нажмите здесь для печати.