- BrainTools - https://www.braintools.ru -

Google расширяет возможности помощника Gemini: анализ видео и демонстрация экрана

Google интегрирует технологию анализа видео в реальном времени в своего помощника Gemini. Об этом компания сообщила на Mobile World Congress.

Google расширяет возможности помощника Gemini: анализ видео и демонстрация экрана - 1

Google представляет функции искусственного интеллекта для своего помощника Gemini [1] на Всемирном мобильном конгрессе (MWC) в Барселоне. Компания объявила, что подписчики Google One AI Premium для Gemini Advanced получат доступ к функциям потокового видео и демонстрации экрана в конце этого месяца.

В Gemini Live появятся две новые важные функции: во-первых, возможность анализировать видео в реальном времени, а во-вторых, функция демонстрации экрана. С помощью обеих функций пользователи смогут делиться визуальным контентом с ИИ-помощником в режиме реального времени — в случае с видео в реальном времени через изображения с камеры, а в случае с демонстрацией экрана — через экран своего смартфона, чтобы получать комментарии к контенту.

Новые функции изначально доступны только на устройствах Android и поддерживают несколько языков. На MWC компания Google продемонстрирует интеграцию этих функций на устройствах-партнёрах от различных производителей Android.

Добавление визуальных функций — важный шаг в развитии ИИ-помощников, которые, как ожидается, будут всё чаще действовать мультимодально и взаимодействовать с реальным миром.

Цель Google на 2025 год — проект «Astra», универсальный мультимодальный ИИ-помощник, который может обрабатывать текстовые, видео- и аудиоданные в режиме реального времени и сохранять их в контексте диалога до десяти минут. Astra также сможет использовать Google Поиск, Lens и Карты.

Неизвестно, планирует ли Google на самом деле выпустить Astra или, что более вероятно, будут ли функции, представленные для Astra, интегрированы в Gemini.

С помощью Gemini Live Google позиционирует себя как конкурента OpenAI и его ChatGPT: с декабря в расширенном голосовом режиме ChatGPT появилась поддержка трансляции в реальном времени и демонстрации экрана.

Источник [2]

Автор: mefdayy

Источник [3]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/12761

URLs in this post:

[1] представляет функции искусственного интеллекта для своего помощника Gemini: https://blog.google/feed/android-gemini-mobile-world-congress-2025/

[2] Источник: https://the-decoder.com/google-sets-march-release-for-geminis-live-video-and-screen-analysis/

[3] Источник: https://habr.com/ru/companies/bothub/news/887518/?utm_source=habrahabr&utm_medium=rss&utm_campaign=887518

www.BrainTools.ru

Rambler's Top100