Google представила ИИ-генератор видео Veo 3

Если Veo 2 произвел на вас впечатление ^[1], то Veo 3 вас просто поразит.

Google IO 2025 ^[2] завершилась, и это была абсолютная масса анонсов в сфере ИИ. Многие люди, включая меня, до сих пор поднимают челюсти с пола. Но из всех анонсов Veo 3 – один из самых захватывающих для меня.

Об остальных анонсах я расскажу в отдельном посте, а пока давайте сосредоточимся на новейшей генеративной видеомодели Google.

Что нового в Veo 3

Вот краткий обзор основных обновлений:

Улучшено качество и физический рендеринг при генерации видео по текстовым и графическим промптам
Большее разрешение при выводе в 4K
Улучшенное соблюдение промптов, что означает более точные ответы на ваши инструкции
Автоматическое добавление речи, например, диалогов и закадрового голоса.
Встроенная функция генерации звука, например музыки и звуковых эффектов.

Да, Veo 3 теперь может автоматически добавлять диалоги. Для меня это самая потрясающая функция из всех. Вероятно, она стала возможной благодаря работе DeepMind над созданием искусственного интеллекта ^[3] для преобразования видео в аудио, о которой было объявлено в июне прошлого года.

Если вы хотите увидеть, насколько он действительно хорош, Google DeepMind ^[4] поделилась несколькими примерами видео с диалогами персонажей в этом посте в X:

Глядя на примеры видеороликов, я думаю, что мы уже наблюдаем следующее поколение ИИ-кинопроизводства.

Мы вступаем в эпоху ИИ-кинопроизводства 2.0

Прошли те времена, когда вам приходилось генерировать видео на одной платформе, например Kling, писать сценарий с помощью ChatGPT, отправлять его в другой инструмент для работы со звуком, например ElevenLabs, а затем запускать отдельную ИИ-модель, чтобы синхронизировать губы с голосом.

Это был сложный рабочий процесс, который мог занять несколько часов, а то и дней. И это еще не считая стоимости использования пяти различных инструментов и подписок.

В Veo 3 все это объединено в единый конвейер. Один промпт. Один инструмент. И каким-то образом он объединяет все вместе – визуально и на слух ^[5].

Возьмем, к примеру, эту сцену:

Промпт: A medium shot frames an old sailor, his knitted blue sailor hat casting a shadow over his eyes, a thick grey beard obscuring his chin. He holds his pipe in one hand, gesturing with it towards the churning, grey sea beyond the ship’s railing. “This ocean, it’s a force, a wild, untamed might. And she commands your awe, with every breaking light”

Только посмотрите, как кинематографична эта сцена, как выразителен персонаж и как хорошо двигаются его губы. Такое ощущение, что вы смотрите, как настоящий актер произносит реплику.

Понимание физического мира также невероятно хорошо. Посмотрите, как этот бумажный кораблик плывет по воде и падает в дренаж.

A paper boat sets sail in a rain-filled gutter. It navigates the current with unexpected grace. It voyages into a storm drain, continuing its journey to unknown waters.

Мне трудно понять, что все это сгенерировано искусственным интеллектом. Никаких инструментов для цифрового моделирования, никаких часов рендеринга и никаких 3D-художников.

В этот момент трудно не представить себе общую картину. Мы приближаемся к миру, в котором целые анимационные короткометражные фильмы или даже полнометражные картины можно будет создавать, просто написав промпт. Не сотни часов работы в Blender или AutoCAD. Не команда художников. Только идея и подходящий инструмент.

На Google IO был показан пример сгенерированной ИИ сцены разговора совы и скунса.

Представляете, как мы близки к тому, чтобы, написав всего один промпт, создать целый фильм? Это немного пугает, но в то же время невероятно захватывает.

Будущее кинопроизводства с помощью ИИ

Google добавила в Veo 3 функции, которые действительно делают его подходящим для реальных съемок. Некоторые из новых возможностей, созданных для кинематографистов, включают:

Использование «ингредиентов», предоставленных режиссером (персонажи, сцены или стили), и сохранение их согласованности на протяжении всего видео.
Режиссеры могут управлять Veo с помощью точных инструкций для камеры и вести съемку по определенной схеме.
Эти возможности помогают режиссерам свободно выражать свои идеи с помощью Veo.

Компания Google объединила усилия с режиссером Дарреном Аронофски и кинематографистом Элизой Макнитт, а также с их новыми предприятиями по созданию историй «Primordial Soup» и «Ancestra», чтобы сформировать возможности Veo для удовлетворения потребностей ^[6] авторов.

Google представила ИИ-генератор видео Veo 3

«Это история, которая охватывает всю историю Вселенной. Но на самом деле это история о маме и о том, что происходит, когда ее ребенок рождается с дырой в сердце. Мы сняли очень эмоциональные спектакли, а затем создали видео, которое никогда не смогли бы снять иначе». – Элиза МакНитт

Она сочетает живое исполнение с видео, сгенерированным Veo, например, микроскопическими мирами и космическими событиями, что позволяет ей придать кинематографический масштаб и эмоции ^[7] глубоко личной истории.

ИИ в наши дни развивается очень быстро.

Генеративные медиа расширяют границы творчества ^[8]. Google тесно сотрудничает с творческим сообществом, чтобы создать технологию, способствующую творческому процессу.

Это касается не только кинематографа.

Jellyfish, известная компания в области цифрового маркетинга, входящая в состав The Brandtech Group, интегрировала Veo в свою высокоэффективную маркетинговую ИИ-платформу Pencil и объединила усилия с Japan Airlines, чтобы предложить генерируемые ИИ развлечения на борту самолета.

Вот пример видеорекламы, созданной с помощью Veo 3:

Вот что сказал Дэвид Джонс, генеральный директор Brandtech:

«Благодаря такому изменению контроля и качества ранее невозможные идеи превращаются в реальный маркетинговый контент за считанные минуты».

По его словам, кампании, созданные с помощью Veo, сократили затраты на производство на 50% и значительно сократили сроки изготовления. Это не просто незначительное улучшение – это перестройка целой отрасли.

Я не удивлюсь, если в скором времени на эту технологию перейдут и другие бренды.

Новый инструмент для создания фильмов с использованием искусственного интеллекта

Наряду с Veo 3 компания Google также запустила инструмент под названием Flow. Он помогает создавать кинематографические клипы, плавно переводить их в сцены и обеспечивать достаточную согласованность, чтобы рассказать историю.

Flow – это инструмент для создания кинематографических роликов, разработанный специально для самых продвинутых моделей Google Deepmind – Veo, Imagen и Gemini.

Вы можете генерировать видеоклипы различными способами:

Text to Video. Создание с помощью текстового промпта
Frames to Video. Загрузите или сгенерируйте изображения для использования в качестве начальных и/или конечных кадров
Ingredients to Video. Загрузите или создайте изображения для использования в качестве предметных или стилевых референсов

Вот список всех возможностей Flow:

Я изучу Flow и напишу обзор с примерами в отдельном посте. Пока же вы можете изучить некоторые часто задаваемые вопросы здесь. Вы также можете посмотреть здесь ^[9] некоторые из лучших ИИ-фильмов, созданных с помощью Flow.

Flow TV

labs.google ^[10]

Как получить доступ к Veo 3

Есть несколько способов попробовать Veo 3 прямо сейчас:

Теперь он доступен в Google AI Studio. Просто откройте вкладку Generate Media и выберите Veo 3, чтобы начать создавать видео.
Он также доступен через новый ИИ-инструмент Google для создания фильмов – Flow. Обратите внимание ^[11], что для его использования требуется подписка на Google AI ^[12].
Veo 3 находится в закрытом режиме предварительного просмотра на Vertex AI ^[13] и станет более доступным в ближайшие недели.

А вот для разработчиков публичного API пока нет. Google говорит, что он появится в Vertex AI в «ближайшие несколько недель», но мы уже слышали об этом раньше. Я надеюсь, что такие сервисы, как Fal AI или Replicate, тоже получат доступ.

На данный момент Veo 3 доступен только в США и только если вы являетесь пользователем тарифного плана Google AI Ultra.

Вот подробная информация о ценах и о том, что входит в каждую подписку:

И да… Google AI Ultra стоит 250 долларов в месяц.

После просмотра всех анонсов на Google IO 2025 я был просто потрясен. Google только что доказала, что лидирует в гонке ИИ. Veo 3 – это не просто небольшое обновление по сравнению с Veo 2. Звук и диалоговые функции – это очень важно. Они могут многое изменить в мире ИИ-кино и рекламы.

Также они представили новый инструмент под названием Flow, с помощью которого можно создавать полноценные сцены и сохранять согласованность действий. Это очень полезно, если вы пытаетесь рассказать историю или создать что-то с четким направлением.

На данный момент я считаю, что Veo 3 опережает другие видеогенераторы, такие как Runway, Kling и Hunyuan. Качество лучше, промпты работают точнее, и в нем больше функций. Но, зная Google, цены и ограничения на результаты могут стать решающим фактором… Посмотрим, когда он будет полностью развернут во всем мире.

Выбранные примеры видеороликов выглядят великолепно, но я жду, когда смогу попробовать Veo 3, прежде чем делать какие-либо предположения или преждевременно высказывать свои мысли. На данный момент, к сожалению, он доступен только для пользователей из США и требует подписки на Google AI Ultra. Ценник в 250 долларов в месяц очень высокий для обычных пользователей вроде меня.

Я жду, когда появится API, чтобы протестировать его и, возможно, использовать в своих веб-приложениях.

В любом случае, что вы думаете о Veo 3? Напишите об этом в комментариях.

Друзья, буду рад, если вы подпишетесь на мой телеграм-канал про нейросети ^[14], чтобы не пропускать анонсы статей, и на канал с гайдами и советами по работе с нейросетями ^[15] – я стараюсь делиться только полезной информацией.

Автор: NeyroEntuziast

Источник ^[16]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/15420

URLs in this post:

[1] впечатление: http://www.braintools.ru/article/2012

[2] Google IO 2025: https://io.google/2025/

[3] интеллекта: http://www.braintools.ru/article/7605

[4] Google DeepMind: https://deepmind.google/discover/blog/generating-audio-for-video/

[5] слух: http://www.braintools.ru/article/6251

[6] потребностей: http://www.braintools.ru/article/9534

[7] эмоции: http://www.braintools.ru/article/9540

[8] творчества: http://www.braintools.ru/creation

[9] здесь: https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Flabs.google%2Fflow%2Ftv%2Fshort-films%3Fsource%3Dpost_page-----ad71e8c9f71b---------------------------------------&postId=1999497

[10] labs.google: https://labs.google/flow/tv/short-films?source=post_page-----ad71e8c9f71b---------------------------------------

[11] внимание: http://www.braintools.ru/article/7595

[12] подписка на Google AI: https://one.google.com/ai?utm_source=flow&utm_medium=web&utm_campaign=vfx_landing_page_offer

[13] Vertex AI: https://cloud.google.com/vertex-ai?hl=en

[14] телеграм-канал про нейросети: https://t.me/+PTlD4pbgpgxjNDJi

[15] гайдами и советами по работе с нейросетями: https://t.me/+FfXvG8E99Lg5OTEy

[16] Источник: https://habr.com/ru/articles/911378/?utm_campaign=911378&utm_source=habrahabr&utm_medium=rss

Нажмите здесь для печати.