- BrainTools - https://www.braintools.ru -

Если Veo 2 произвел на вас впечатление [1], то Veo 3 вас просто поразит.
Google IO 2025 [2] завершилась, и это была абсолютная масса анонсов в сфере ИИ. Многие люди, включая меня, до сих пор поднимают челюсти с пола. Но из всех анонсов Veo 3 – один из самых захватывающих для меня.
Об остальных анонсах я расскажу в отдельном посте, а пока давайте сосредоточимся на новейшей генеративной видеомодели Google.
Вот краткий обзор основных обновлений:
Улучшено качество и физический рендеринг при генерации видео по текстовым и графическим промптам
Большее разрешение при выводе в 4K
Улучшенное соблюдение промптов, что означает более точные ответы на ваши инструкции
Автоматическое добавление речи, например, диалогов и закадрового голоса.
Встроенная функция генерации звука, например музыки и звуковых эффектов.
Да, Veo 3 теперь может автоматически добавлять диалоги. Для меня это самая потрясающая функция из всех. Вероятно, она стала возможной благодаря работе DeepMind над созданием искусственного интеллекта [3] для преобразования видео в аудио, о которой было объявлено в июне прошлого года.
Если вы хотите увидеть, насколько он действительно хорош, Google DeepMind [4] поделилась несколькими примерами видео с диалогами персонажей в этом посте в X:
Глядя на примеры видеороликов, я думаю, что мы уже наблюдаем следующее поколение ИИ-кинопроизводства.
Прошли те времена, когда вам приходилось генерировать видео на одной платформе, например Kling, писать сценарий с помощью ChatGPT, отправлять его в другой инструмент для работы со звуком, например ElevenLabs, а затем запускать отдельную ИИ-модель, чтобы синхронизировать губы с голосом.
Это был сложный рабочий процесс, который мог занять несколько часов, а то и дней. И это еще не считая стоимости использования пяти различных инструментов и подписок.
В Veo 3 все это объединено в единый конвейер. Один промпт. Один инструмент. И каким-то образом он объединяет все вместе – визуально и на слух [5].
Возьмем, к примеру, эту сцену:
Промпт: A medium shot frames an old sailor, his knitted blue sailor hat casting a shadow over his eyes, a thick grey beard obscuring his chin. He holds his pipe in one hand, gesturing with it towards the churning, grey sea beyond the ship’s railing. “This ocean, it’s a force, a wild, untamed might. And she commands your awe, with every breaking light”
Только посмотрите, как кинематографична эта сцена, как выразителен персонаж и как хорошо двигаются его губы. Такое ощущение, что вы смотрите, как настоящий актер произносит реплику.
Понимание физического мира также невероятно хорошо. Посмотрите, как этот бумажный кораблик плывет по воде и падает в дренаж.
A paper boat sets sail in a rain-filled gutter. It navigates the current with unexpected grace. It voyages into a storm drain, continuing its journey to unknown waters.
Мне трудно понять, что все это сгенерировано искусственным интеллектом. Никаких инструментов для цифрового моделирования, никаких часов рендеринга и никаких 3D-художников.
В этот момент трудно не представить себе общую картину. Мы приближаемся к миру, в котором целые анимационные короткометражные фильмы или даже полнометражные картины можно будет создавать, просто написав промпт. Не сотни часов работы в Blender или AutoCAD. Не команда художников. Только идея и подходящий инструмент.
На Google IO был показан пример сгенерированной ИИ сцены разговора совы и скунса.
Представляете, как мы близки к тому, чтобы, написав всего один промпт, создать целый фильм? Это немного пугает, но в то же время невероятно захватывает.
Google добавила в Veo 3 функции, которые действительно делают его подходящим для реальных съемок. Некоторые из новых возможностей, созданных для кинематографистов, включают:
Использование «ингредиентов», предоставленных режиссером (персонажи, сцены или стили), и сохранение их согласованности на протяжении всего видео.
Режиссеры могут управлять Veo с помощью точных инструкций для камеры и вести съемку по определенной схеме.
Эти возможности помогают режиссерам свободно выражать свои идеи с помощью Veo.
Компания Google объединила усилия с режиссером Дарреном Аронофски и кинематографистом Элизой Макнитт, а также с их новыми предприятиями по созданию историй «Primordial Soup» и «Ancestra», чтобы сформировать возможности Veo для удовлетворения потребностей [6] авторов.
«Это история, которая охватывает всю историю Вселенной. Но на самом деле это история о маме и о том, что происходит, когда ее ребенок рождается с дырой в сердце. Мы сняли очень эмоциональные спектакли, а затем создали видео, которое никогда не смогли бы снять иначе». – Элиза МакНитт
Она сочетает живое исполнение с видео, сгенерированным Veo, например, микроскопическими мирами и космическими событиями, что позволяет ей придать кинематографический масштаб и эмоции [7] глубоко личной истории.
ИИ в наши дни развивается очень быстро.
Генеративные медиа расширяют границы творчества [8]. Google тесно сотрудничает с творческим сообществом, чтобы создать технологию, способствующую творческому процессу.
Это касается не только кинематографа.
Jellyfish, известная компания в области цифрового маркетинга, входящая в состав The Brandtech Group, интегрировала Veo в свою высокоэффективную маркетинговую ИИ-платформу Pencil и объединила усилия с Japan Airlines, чтобы предложить генерируемые ИИ развлечения на борту самолета.
Вот пример видеорекламы, созданной с помощью Veo 3:
Вот что сказал Дэвид Джонс, генеральный директор Brandtech:
«Благодаря такому изменению контроля и качества ранее невозможные идеи превращаются в реальный маркетинговый контент за считанные минуты».
По его словам, кампании, созданные с помощью Veo, сократили затраты на производство на 50% и значительно сократили сроки изготовления. Это не просто незначительное улучшение – это перестройка целой отрасли.
Я не удивлюсь, если в скором времени на эту технологию перейдут и другие бренды.
Наряду с Veo 3 компания Google также запустила инструмент под названием Flow. Он помогает создавать кинематографические клипы, плавно переводить их в сцены и обеспечивать достаточную согласованность, чтобы рассказать историю.
Flow – это инструмент для создания кинематографических роликов, разработанный специально для самых продвинутых моделей Google Deepmind – Veo, Imagen и Gemini.
Вы можете генерировать видеоклипы различными способами:
Text to Video. Создание с помощью текстового промпта
Frames to Video. Загрузите или сгенерируйте изображения для использования в качестве начальных и/или конечных кадров
Ingredients to Video. Загрузите или создайте изображения для использования в качестве предметных или стилевых референсов
Вот список всех возможностей Flow:
Я изучу Flow и напишу обзор с примерами в отдельном посте. Пока же вы можете изучить некоторые часто задаваемые вопросы здесь. Вы также можете посмотреть здесь [9] некоторые из лучших ИИ-фильмов, созданных с помощью Flow.
Есть несколько способов попробовать Veo 3 прямо сейчас:
Теперь он доступен в Google AI Studio. Просто откройте вкладку Generate Media и выберите Veo 3, чтобы начать создавать видео.
Он также доступен через новый ИИ-инструмент Google для создания фильмов – Flow. Обратите внимание [11], что для его использования требуется подписка на Google AI [12].
Veo 3 находится в закрытом режиме предварительного просмотра на Vertex AI [13] и станет более доступным в ближайшие недели.
А вот для разработчиков публичного API пока нет. Google говорит, что он появится в Vertex AI в «ближайшие несколько недель», но мы уже слышали об этом раньше. Я надеюсь, что такие сервисы, как Fal AI или Replicate, тоже получат доступ.
На данный момент Veo 3 доступен только в США и только если вы являетесь пользователем тарифного плана Google AI Ultra.
Вот подробная информация о ценах и о том, что входит в каждую подписку:
И да… Google AI Ultra стоит 250 долларов в месяц.
После просмотра всех анонсов на Google IO 2025 я был просто потрясен. Google только что доказала, что лидирует в гонке ИИ. Veo 3 – это не просто небольшое обновление по сравнению с Veo 2. Звук и диалоговые функции – это очень важно. Они могут многое изменить в мире ИИ-кино и рекламы.
Также они представили новый инструмент под названием Flow, с помощью которого можно создавать полноценные сцены и сохранять согласованность действий. Это очень полезно, если вы пытаетесь рассказать историю или создать что-то с четким направлением.
На данный момент я считаю, что Veo 3 опережает другие видеогенераторы, такие как Runway, Kling и Hunyuan. Качество лучше, промпты работают точнее, и в нем больше функций. Но, зная Google, цены и ограничения на результаты могут стать решающим фактором… Посмотрим, когда он будет полностью развернут во всем мире.
Выбранные примеры видеороликов выглядят великолепно, но я жду, когда смогу попробовать Veo 3, прежде чем делать какие-либо предположения или преждевременно высказывать свои мысли. На данный момент, к сожалению, он доступен только для пользователей из США и требует подписки на Google AI Ultra. Ценник в 250 долларов в месяц очень высокий для обычных пользователей вроде меня.
Я жду, когда появится API, чтобы протестировать его и, возможно, использовать в своих веб-приложениях.
В любом случае, что вы думаете о Veo 3? Напишите об этом в комментариях.
Друзья, буду рад, если вы подпишетесь на мой телеграм-канал про нейросети [14], чтобы не пропускать анонсы статей, и на канал с гайдами и советами по работе с нейросетями [15] – я стараюсь делиться только полезной информацией.
Автор: NeyroEntuziast
Источник [16]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/15420
URLs in this post:
[1] впечатление: http://www.braintools.ru/article/2012
[2] Google IO 2025: https://io.google/2025/
[3] интеллекта: http://www.braintools.ru/article/7605
[4] Google DeepMind: https://deepmind.google/discover/blog/generating-audio-for-video/
[5] слух: http://www.braintools.ru/article/6251
[6] потребностей: http://www.braintools.ru/article/9534
[7] эмоции: http://www.braintools.ru/article/9540
[8] творчества: http://www.braintools.ru/creation
[9] здесь: https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Flabs.google%2Fflow%2Ftv%2Fshort-films%3Fsource%3Dpost_page-----ad71e8c9f71b---------------------------------------&postId=1999497
[10] labs.google: https://labs.google/flow/tv/short-films?source=post_page-----ad71e8c9f71b---------------------------------------
[11] внимание: http://www.braintools.ru/article/7595
[12] подписка на Google AI: https://one.google.com/ai?utm_source=flow&utm_medium=web&utm_campaign=vfx_landing_page_offer
[13] Vertex AI: https://cloud.google.com/vertex-ai?hl=en
[14] телеграм-канал про нейросети: https://t.me/+PTlD4pbgpgxjNDJi
[15] гайдами и советами по работе с нейросетями: https://t.me/+FfXvG8E99Lg5OTEy
[16] Источник: https://habr.com/ru/articles/911378/?utm_campaign=911378&utm_source=habrahabr&utm_medium=rss
Нажмите здесь для печати.