- BrainTools - https://www.braintools.ru -

Kuaishou Technology представила новую генеративную модель SVG [1], построенную на архитектуре Latent Diffusion, но без классического блока вариационного автоэнкодера. Отказ от VAE стал ключевым шагом, позволившим модели работать значительно быстрее и стабильнее. Вместо привычного кодировщика компания применила самообучающиеся представления, которые напрямую формируют латентное пространство без потерь точности.

Результаты оказались впечатляющими. Обучение [2] модели идёт в 62 раза быстрее, а инференс в 35 раз. При этом качество изображений не только не ухудшилось, но даже улучшилось. Убраны искажения, которые обычно возникают при переходе между латентным и визуальным пространством. Модель генерирует картинки высокого разрешения с более естественными текстурами и плавными переходами.

SVG рассматривают как возможное новое направление развития диффузионных архитектур. Простая, энергоэффективная и быстрая альтернатива решениям с VAE открывает путь к созданию генеративных моделей, способных работать в реальном времени даже на мобильных устройствах.
Делегируйте часть рутинных задач вместе с BotHub! [3] Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке [4] вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Подробнее [5]
Автор: cognitronn
Источник [6]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/21179
URLs in this post:
[1] SVG: https://huggingface.co/papers/2510.15301
[2] Обучение: http://www.braintools.ru/article/5125
[3] BotHub!: https://bothub.chat/?utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_source=contentmarketing&utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_medium=habr&utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_campaign=news&utm%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C%5C_content=KUAISHOU%20TECHNOLOGY%20UNVEILS%20NEW%20GENERATIVE%20MODEL%20SVG
[4] По ссылке: https://bothub.chat/?invitedBy=m_aGCkuyTgqllHCK0dUc7
[5] Подробнее: https://arxiv.org/html/2510.15301v3
[6] Источник: https://habr.com/ru/companies/bothub/news/960616/?utm_source=habrahabr&utm_medium=rss&utm_campaign=960616
Нажмите здесь для печати.