Почему диффузия рисует швы на 40-мегапиксельных фото и как сделать тайлы с памятью
Я больше двадцати лет отработала ретушёром и четвёртый год пытаюсь натянуть сову на глобус, заставить диффузионки нормально работать с профессиональными кадрами на 40+ мегапикселей. Все эти годы любой подход крутится вокруг тайлов. Это первая статья из цикла. Три идеи, ресерч, предварительные тесты. Откуда вообще задача.
Обновлённый токенизатор видео K-VAE 2.0 от Сбера
Несколько месяцев назад мы выпустили токенизаторы для видео и изображений — KVAE-1.0. Сегодня представляем следующее поколение: KVAE-2.0 — две новых модели, которые превосходят Wan 2.2 и HunyuanVideo 1.5 по объективным метрикам и качеству генерации и являются, таким образом, лучшими открытыми видео-токенизаторами. Код и веса выложены в открытый доступ.
От Stable Diffusion до тонкой настройки LLM: разбираем новую книгу-практикум
Генеративный ИИ перестал быть магией и стал инструментом. Но чтобы им уверенно пользоваться, нужно понимать, как работают трансформеры и диффузионные модели, и уметь их адаптировать. В этом поможет
Дорого, медленно, некачественно? Как мы создали технологию виртуальной примерки с ИИ, ломающую эти стереотипы
Привет! На связи Арсений, тимлид AI-направления Mad Brains. В этой статье расскажу, как мы реализовали технологию для виртуальной примерки одежды Virtual Try-On на основе диффузионных моделей и прошли путь от «сырых» и непригодных для продакшена изображений к действительно качественной виртуальной примерке.
Фабрика данных 2030: от GAN-конвейеров до каузальных сетей — кто отвечает за рождение синтетической реальности
1. Вступление: синтетика выходит из-подпольяДесять лет назад мы говорили о «данных–нефть». В 2025-м метафора смещается: нефть закончилась, а нужен устойчивый источник энергии. Синтетические наборы — эта самая «зелёная электростанция» для AI-экономики.Почему это не очередная хайповая игрушка?Дефицит реальных выборок. Регуляторы закрутили гайки (GDPR, HIPAA, китайский PIPL). В финтехе и медицине доступных датасетов меньше, чем стартапов, желающих их тренировать.Приватность без компромиссов.
Black Forest Labs выпустили FLUX.1 Kontext — контекстный редактор изображений
Здравствуйте! Меня зовут Богдан, я являюсь автором телеграм канала Друг Опенсурса, приятного прочтения.
Правит картинки силой слов: редактор изображений от Сбера с попиксельной точностью
Пример работы нашей модели. Только текстовые запросы — никаких масок!
Как мы коня в пальто одевали. Neural Image Editing: Часть 1 — от инпейнтинга до DDIM Inversion
Что делать, если хочешь отредактировать картинку?

