Google представляет инструменты для разработчиков и новые функции для пользователей

На I/O 2025 компания Google представила ряд новых функций для создателей, разработчиков и обычных пользователей, помимо основных анонсов, связанных с поиском и моделями ИИ. Обновления охватывают всё: от генераторов видео и изображений на базе ИИ до новых платформ XR, инструментов для агентов и возможностей обучения ^[1].

Компания представила Veo 3 — новый генератор видео на основе ИИ, который может создавать видео с оригинальными звуковыми дорожками, включая фоновые звуки и диалоги. Это отличает Veo 3 от конкурентов, таких как Sora от OpenAI, которая не поддерживает аудио. Veo 3 в настоящее время доступен пользователям в США по подписке Ultra и корпоративным клиентам через Vertex AI.

Наряду с Veo 3 компания Google также выпустила Imagen 4 — обновлённый генератор изображений с улучшенной детализацией, более качественной типографикой и поддержкой нескольких форматов. И Veo 3, и Imagen 4 уже интегрированы в несколько продуктов Google, включая приложение Gemini, Workspace, Whisk и Flow — новый инструмент для создания фильмов с помощью ИИ, который может генерировать сложные клипы, сцены и целые фильмы. Flow объединяет в себе такие функции, как управление камерой и перспективой, управление ресурсами и возможность смешивать пользовательский контент и контент, созданный ИИ.

Google также предоставил музыкантам и продюсерам доступ к Lyria 2, своей модели искусственного интеллекта ^[2] для создания музыки, через YouTube Shorts и Vertex AI.

AI Ultra и Pro: подписки для опытных пользователей

Google запускает новую премиум-подписку AI Ultra по цене 249,99 долларов в месяц. Этот тарифный план предлагает доступ к лучшим моделям ИИ, инструментам для глубокого анализа, созданию видео и изображений с помощью Veo 3 и Imagen 4, функциям агента (Project Mariner), YouTube Premium и 30 ТБ хранилища.

Приложение Gemini получает функцию Gemini Live, которая позволяет получать помощь в режиме реального времени с помощью камеры и демонстрации экрана — это полезно при устранении неполадок или планировании мероприятий. Gemini также интегрируется в Chrome, позволяя пользователям анализировать и обобщать контент веб-сайтов с помощью ИИ.

Для Google Meet внедряется новая функция перевода в реальном времени на основе искусственного интеллекта, которая имитирует тон и выражение говорящего. Изначально эта функция будет доступна на английском и испанском языках для подписчиков Pro и Ultra, а затем и на других языках.

Персонализированные интеллектуальные ответы Gmail теперь используют данные из электронной почты пользователей и их аккаунтов в Google Диске для создания ответов в личном стиле пользователя. Эта функция доступна по запросу и требует явного согласия пользователя.

Инструменты для разработчиков: Gemini API, новые агенты и открытые модели

Google представил множество новых инструментов для разработчиков. API Gemini теперь поддерживает расширенные функции, такие как управление компьютером (Project Mariner), вывод звука, асинхронный вызов функций и протокол контекста модели (MCP) ^[3] для интеграции внешних инструментов. Новые модели, такие как Gemma 3n ^[4] (лёгкая, мультимодальная, предназначенная для мобильных устройств), MedGemma (для медицинских приложений) и SignGemma (для языка жестов), расширяют линейку.

Что касается программирования, то такие новые продукты, как Gemini Code Assist, асинхронный агент для программирования Jules ^[5] и генератор пользовательского интерфейса Stitch, направлены на автоматизацию и ускорение процесса разработки.

Google запускает SynthID Detector — портал, который может идентифицировать контент, созданный искусственным интеллектом, включая изображения, текст, аудио и видео, с помощью невидимых водяных знаков. Эта технология призвана помочь предотвратить распространение дезинформации и повысить прозрачность в СМИ. По данным Google, более 10 миллиардов элементов уже помечены SynthID ^[6].

Компания также представила Android XR — новую платформу для устройств дополненной и смешанной реальности. Благодаря интеграции с Gemini очки и гарнитуры XR получат вспомогательные функции, такие как перевод в реальном времени, навигация, обмен сообщениями и анализ окружающей среды с точки зрения ^[7] пользователя. Google уже сотрудничает с такими брендами очков, как Gentle Monster и Warby Parker, а выпуск SDK для разработчиков запланирован на конец этого года.

Источник ^[8]

Автор: mefdayy

Источник ^[9]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/15404

URLs in this post:

[1] обучения: http://www.braintools.ru/article/5125

[2] интеллекта: http://www.braintools.ru/article/7605

[3] протокол контекста модели (MCP): https://the-decoder.com/anthropics-new-open-protocol-lets-ai-systems-tap-into-any-data-source/

[4] Gemma 3n: https://the-decoder.com/google-upgrades-gemini-2-5-pro-with-a-new-deep-think-mode-for-advanced-reasoning-abilities/

[5] асинхронный агент для программирования Jules: https://the-decoder.com/google-launches-coding-agent-jules/

[6] SynthID: https://the-decoder.com/google-deepmind-might-have-a-solution-to-the-ai-image-problem/

[7] зрения: http://www.braintools.ru/article/6238

[8] Источник: https://the-decoder.com/google-shows-ai-filmmaking-tool-xr-glasses-and-launches-250-gemini-subscription/

[9] Источник: https://habr.com/ru/companies/bothub/news/911286/?utm_source=habrahabr&utm_medium=rss&utm_campaign=911286

Нажмите здесь для печати.