- BrainTools - https://www.braintools.ru -
После нескольких месяцев спекуляций Midjourney выпустила свою первую видеомодель. Компания называет этот шаг важной вехой на пути к системам искусственного интеллекта [1], способным моделировать целые 3D-миры в реальном времени.

Новая функция «Изображение в видео» позволяет пользователям превращать любое изображение Midjourney [2] в короткий анимированный клип. Анимация выполняется с помощью новой кнопки «Анимировать» в веб-интерфейсе Midjourney. Пользователи могут выбирать между автоматическим режимом, в котором система определяет движение, и ручным режимом, в котором они сами описывают, как должна разворачиваться анимация.
Есть два основных режима: «Низкое движение» лучше всего подходит для сцен с неподвижной камерой и медленным движением, а «Высокое движение» более агрессивно анимирует как камеру, так и объект съёмки, хотя иногда это может привести к менее точным результатам, как утверждает Midjourney.
Каждое видео можно увеличить примерно на четыре секунды, в общей сложности до четырёх раз. Пользователи также могут изменять исходное изображение при каждом увеличении.
Пользователи также могут анимировать изображения, созданные за пределами Midjourney, перетащив их в панель подсказок и выбрав в качестве «начального кадра». Затем желаемое движение описывается в текстовой подсказке.
Midjourney не публикует официальные спецификации по разрешению, частоте кадров или битрейту, и пока не предусмотрено встроенное масштабирование. Однако загруженные видео представлены в виде файлов MP4 с разрешением 480p и частотой 24 кадра в секунду.
Функция создания видео в настоящее время доступна только через веб-интерфейс. Каждое видео стоит примерно в восемь раз дороже, чем изображение, и генерирует четыре пятисекундных клипа. На практике это примерно один эквивалент изображения на секунду видео. Midjourney утверждает, что это примерно в 25 раз дешевле, чем у конкурентов.
Для подписчиков уровня «Pro» и выше Midjourney также тестирует «Режим расслабленного видео», который позволяет пользователям создавать видео, не используя минуты быстрой обработки, что потенциально снижает стоимость одной работы. Компания заявляет, что цены будут скорректированы в ближайшие недели в зависимости от спроса и нагрузки на сервер.
Midjourney описывает эту видеомодель как необходимый промежуточный этап. В конечном итоге планируется объединить видеомодели, 3D-элементы и обработку в реальном времени в единую платформу. Основатель Дэвид Хольц давно стремился создать систему, способную моделировать мир в реальном времени [3]. Уроки, полученные при создании видеомодели, также используются в существующих инструментах Midjourney для работы с изображениями.
В сфере видео с использованием ИИ новая модель Google Veo 3 считается лидером [4]. Veo 3 может генерировать видео непосредственно по текстовым подсказкам, без необходимости в исходном изображении, а также добавлять голоса и звуковые эффекты, что делает её уникальной на современном рынке видео с использованием ИИ.
Тем временем Disney и Universal подали совместный иск против Midjourney [5], утверждая, что генератор изображений на основе ИИ создаёт несанкционированные изображения персонажей, защищённых товарными знаками, таких как Дарт Вейдер и Миньоны. В жалобе, поданной в окружной суд США в Калифорнии, Midjourney обвиняется в неоднократном копировании материалов, защищённых авторским правом, несмотря на предыдущие предупреждения.
Обе студии требуют возмещения ущерба, судебного разбирательства с участием присяжных и запрета на дальнейшее использование защищенных персонажей. Аналогичные споры об авторских правах с участием Midjourney начались в 2023 году [6]. До сих пор Midjourney не давала публичных комментариев, и неясно, какие видеоданные использовались для обучения [7] новой модели.
Хотите быть в курсе важных новостей из мира ИИ? Подписывайтесь на наш Telegram‑канал BotHub AI News [8].
Источник [9]
Автор: mefdayy
Источник [10]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/16370
URLs in this post:
[1] интеллекта: http://www.braintools.ru/article/7605
[2] Midjourney: https://the-decoder.com/midjourney-dall-e-competitor-enters-open-beta/
[3] Дэвид Хольц давно стремился создать систему, способную моделировать мир в реальном времени: https://the-decoder.com/midjourney-ceo-in-10-years-xbox-ai-will-dream-your-video-game/
[4] новая модель Google Veo 3 считается лидером: https://the-decoder.com/google-says-veo-3-users-have-generated-millions-of-ai-videos-in-just-a-few-days/
[5] Disney и Universal подали совместный иск против Midjourney: https://the-decoder.com/artificial-intelligence-news/ai-practice/
[6] Аналогичные споры об авторских правах с участием Midjourney начались в 2023 году: https://the-decoder.com/midjourney-will-find-you-and-collect-that-money-if-you-infringe-any-ip-with-v6/
[7] обучения: http://www.braintools.ru/article/5125
[8] BotHub AI News: https://t.me/bothub
[9] Источник: https://the-decoder.com/midjourney-launches-its-first-video-model-letting-users-turn-images-into-short-animated-clips/
[10] Источник: https://habr.com/ru/companies/bothub/news/919690/?utm_source=habrahabr&utm_medium=rss&utm_campaign=919690
Нажмите здесь для печати.