- BrainTools - https://www.braintools.ru -
На I/O 2025 компания Google представила ряд новых функций для создателей, разработчиков и обычных пользователей, помимо основных анонсов, связанных с поиском и моделями ИИ. Обновления охватывают всё: от генераторов видео и изображений на базе ИИ до новых платформ XR, инструментов для агентов и возможностей обучения [1].

Компания представила Veo 3 — новый генератор видео на основе ИИ, который может создавать видео с оригинальными звуковыми дорожками, включая фоновые звуки и диалоги. Это отличает Veo 3 от конкурентов, таких как Sora от OpenAI, которая не поддерживает аудио. Veo 3 в настоящее время доступен пользователям в США по подписке Ultra и корпоративным клиентам через Vertex AI.
Наряду с Veo 3 компания Google также выпустила Imagen 4 — обновлённый генератор изображений с улучшенной детализацией, более качественной типографикой и поддержкой нескольких форматов. И Veo 3, и Imagen 4 уже интегрированы в несколько продуктов Google, включая приложение Gemini, Workspace, Whisk и Flow — новый инструмент для создания фильмов с помощью ИИ, который может генерировать сложные клипы, сцены и целые фильмы. Flow объединяет в себе такие функции, как управление камерой и перспективой, управление ресурсами и возможность смешивать пользовательский контент и контент, созданный ИИ.
Google также предоставил музыкантам и продюсерам доступ к Lyria 2, своей модели искусственного интеллекта [2] для создания музыки, через YouTube Shorts и Vertex AI.
Google запускает новую премиум-подписку AI Ultra по цене 249,99 долларов в месяц. Этот тарифный план предлагает доступ к лучшим моделям ИИ, инструментам для глубокого анализа, созданию видео и изображений с помощью Veo 3 и Imagen 4, функциям агента (Project Mariner), YouTube Premium и 30 ТБ хранилища.
Приложение Gemini получает функцию Gemini Live, которая позволяет получать помощь в режиме реального времени с помощью камеры и демонстрации экрана — это полезно при устранении неполадок или планировании мероприятий. Gemini также интегрируется в Chrome, позволяя пользователям анализировать и обобщать контент веб-сайтов с помощью ИИ.
Для Google Meet внедряется новая функция перевода в реальном времени на основе искусственного интеллекта, которая имитирует тон и выражение говорящего. Изначально эта функция будет доступна на английском и испанском языках для подписчиков Pro и Ultra, а затем и на других языках.
Персонализированные интеллектуальные ответы Gmail теперь используют данные из электронной почты пользователей и их аккаунтов в Google Диске для создания ответов в личном стиле пользователя. Эта функция доступна по запросу и требует явного согласия пользователя.
Google представил множество новых инструментов для разработчиков. API Gemini теперь поддерживает расширенные функции, такие как управление компьютером (Project Mariner), вывод звука, асинхронный вызов функций и протокол контекста модели (MCP) [3] для интеграции внешних инструментов. Новые модели, такие как Gemma 3n [4] (лёгкая, мультимодальная, предназначенная для мобильных устройств), MedGemma (для медицинских приложений) и SignGemma (для языка жестов), расширяют линейку.
Что касается программирования, то такие новые продукты, как Gemini Code Assist, асинхронный агент для программирования Jules [5] и генератор пользовательского интерфейса Stitch, направлены на автоматизацию и ускорение процесса разработки.
Google запускает SynthID Detector — портал, который может идентифицировать контент, созданный искусственным интеллектом, включая изображения, текст, аудио и видео, с помощью невидимых водяных знаков. Эта технология призвана помочь предотвратить распространение дезинформации и повысить прозрачность в СМИ. По данным Google, более 10 миллиардов элементов уже помечены SynthID [6].
Компания также представила Android XR — новую платформу для устройств дополненной и смешанной реальности. Благодаря интеграции с Gemini очки и гарнитуры XR получат вспомогательные функции, такие как перевод в реальном времени, навигация, обмен сообщениями и анализ окружающей среды с точки зрения [7] пользователя. Google уже сотрудничает с такими брендами очков, как Gentle Monster и Warby Parker, а выпуск SDK для разработчиков запланирован на конец этого года.
Источник [8]
Автор: mefdayy
Источник [9]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/15404
URLs in this post:
[1] обучения: http://www.braintools.ru/article/5125
[2] интеллекта: http://www.braintools.ru/article/7605
[3] протокол контекста модели (MCP): https://the-decoder.com/anthropics-new-open-protocol-lets-ai-systems-tap-into-any-data-source/
[4] Gemma 3n: https://the-decoder.com/google-upgrades-gemini-2-5-pro-with-a-new-deep-think-mode-for-advanced-reasoning-abilities/
[5] асинхронный агент для программирования Jules: https://the-decoder.com/google-launches-coding-agent-jules/
[6] SynthID: https://the-decoder.com/google-deepmind-might-have-a-solution-to-the-ai-image-problem/
[7] зрения: http://www.braintools.ru/article/6238
[8] Источник: https://the-decoder.com/google-shows-ai-filmmaking-tool-xr-glasses-and-launches-250-gemini-subscription/
[9] Источник: https://habr.com/ru/companies/bothub/news/911286/?utm_source=habrahabr&utm_medium=rss&utm_campaign=911286
Нажмите здесь для печати.