Правит картинки силой слов: редактор изображений от Сбера с попиксельной точностью
Пример работы нашей модели. Только текстовые запросы — никаких масок!
За полчаса установил DeepSeek 1.5B, пока вы искали GPT подешевле
Решил установить и протестировать возможности DeepSeek 1.5B — компактной языковой модели, которая работает без тяжёлого железа и запускается даже на домашнем сервере. В этой статье покажу и расскажу:
Новая генеративная модель Kandinsky 3D для создания 3D-объектов. Как она работает и кому будет полезна
Салют, Хабр! В прошлом году мы рассказали
Как мы коня в пальто одевали. Neural Image Editing: Часть 1 — от инпейнтинга до DDIM Inversion
Что делать, если хочешь отредактировать картинку?
DiffSplat: генерация 3D-объектов с помощью диффузионных моделей изображений
Полезно было бы уметь генерировать по текстовому описанию не только картинки, а полноценный 3D-объект, который можно рассмотреть со всех сторон. Это открывает огромные возможности для дизайна, игр, виртуальной реальности. Однако генерация 3D-контента — задача непростая. Современные методы требуют огромных объемов данных для обучения и страдают от несогласованности между разными ракурсами.
Нейросети для локальной генерации видео
Давно было понятно, что генерация видео с помощью нейросетей станет возможной локально на ПК. Это полезно для всех, кто не готов платить за подписки, но готов платить за мощное железо. Потому что видео-модели требуют значительных вычислительных ресурсов.На текущий момент существует несколько ключевых моделей, которые подходят для локальной установки: stable Video Diffusion, Mochi 1, Hunyan Video и LTX Video. Каждая из них имеет свои уникальные особенности, которых ниже.Stable Video Diffusion (SVD)
От каскадных моделей до картинок в 4к: как эволюционировали диффузионки
На дворе 2025 год. Генерацией картинок и видео в интернете больше никого не удивишь. Генеративный контент повсюду, а его качество настолько высоко, что бывает трудно отличить синтетическую картинку от реальной.
Перенос головы с картинки — сложно ли это? Модель GHOST-2.0
В последнее время технологии замены лиц находят все больше применений. Помимо использования в развлекательных целях, они стали особенно важны для индустрии фильмов и рекламы, позволяя существенно ускорить и удешевить производство. Несколько лет назад мы так же не остались в стороне от этой темы и выпустили свою модель переноса лиц с фото на фото или видео (в простонародье, face swap) — GHOST. Основная фишка модели была в отсутствии необходимости обучать её под каждый новый источник переноса лица — весь процесс буквально происходил по одной фотке (отсюда и буквы “OS=one shot” в названии модели)
Погружение в мир диффузионных моделей — путеводитель для новичков
Диффузионные модели перевернули мир генеративного искусственного интеллекта, вытеснив GAN'ы и вариационные автоэнкодеры. Но как они работают? Чем отличаются друг от друга? И как научиться их использовать?Эта статья — путеводитель для тех, кто хочет разобраться в диффузионных моделях с нуля. В ней вы найдете

