- BrainTools - https://www.braintools.ru -

Apple создает альтернативу диффузионным нейросетям

Apple создает альтернативу диффузионным нейросетям - 1

Исследователи представили STARFlow V, новую модель для генерации видео, построенную не на диффузии, а на нормализующих потоках. Команда заявляет, что это первая система такого масштаба, которая демонстрирует стабильную и конкурентоспособную генерацию без многошагового шумоподавления. Модель использует полностью сквозное обучение [1] и причинную структуру, что дает ей возможность создавать кадры в правильном временном порядке и без накопления ошибок.

В основе STARFlow V лежит архитектура с глобальными и локальными латентными пространствами. Глобальная часть управляет динамикой и согласованностью между кадрами, локальная часть отвечает за детально прорисованную картинку. Такой подход позволяет модели поддерживать высокое качество и плавность видео, даже если ролик получается длинным. На демонстрациях видно, что STARFlow V создает видео с устойчивой структурой, реалистичными объектами и точными переходами между сценами.

Разработчики применили алгоритм Flow Score Matching и эффективные итерации обновления, чтобы ускорить обучение и саму генерацию. В итоге модель работает быстрее, чем диффузионные аналоги с сопоставимым качеством. STARFlow V справляется с задачами text to video, image to video и video to video, а также может реконструировать видео из латентного пространства. Демонстрации показывают уверенную обработку сложных движений, света, теней и перспективы.

Команда открыла код [2], примеры и описание подхода. Исследователи считают, что STARFlow V становится шагом к тому, чтобы нормализующие потоки перестали быть экспериментальной техникой и стали полноценной альтернативой доминирующим диффузионным моделям. Проект показывает, что направление с потоками может дать более простую и прямую генерацию, без долгих итераций и без потерь согласованности.


Делегируйте часть рутинных задач вместе с BotHub! [3] Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке [4] вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Автор: cognitronn

Источник [5]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/22525

URLs in this post:

[1] обучение: http://www.braintools.ru/article/5125

[2] открыла код: https://starflow-v.github.io/#longer-generation

[3] BotHub!: https://bothub.chat/?utm_source=contentmarketing&utm_medium=habr&utm_campaign=news&utm_content=APPLE%20IS%20DEVELOPING%20AN%20ALTERNATIVE%20TO%20DIFFUSION%20NEURAL%20NETWORKS.

[4] По ссылке: https://bothub.chat/?invitedBy=m_aGCkuyTgqllHCK0dUc7

[5] Источник: https://habr.com/ru/companies/bothub/news/971272/?utm_source=habrahabr&utm_medium=rss&utm_campaign=971272

www.BrainTools.ru

Rambler's Top100