Kandinsky 6.0 Image Pro — новый уровень редактирования изображений. Kandinsky 6.0.. Kandinsky 6.0. генерация изображений.. Kandinsky 6.0. генерация изображений. редактирование изображений.

В конце прошлого года на конференции AI Journey мы открыли доступ к линейке моделей Kandinsky 5, включая Text‑to‑Image и Image Editing Lite. Сегодня мы представляем масштабное обновление — единую модель генерации и редактирования изображений Kandinsky 6.0 Image Pro. Новая модель работает более качественно и стабильно в задачах генерации изображений по тексту, но особое внимание мы уделили именно задаче редактирования. По результатам сравнений Kandinsky 6.0 Image Pro работает на уровне Flux 2 Max и превосходит GPT Image 1.5. При этом, благодаря переходу к архитектуре MoE, эффективного распараллеливания инференса и оптимизации механизма внимания, модель удалось ускорить более чем на 40% по сравнению с предыдущей версией.

Side-By-Side сравнения Kandinsky 6.0 Image Pro с другими моделями. Первое число над каждым столбцом — доля побед Kandinsky.
Side-By-Side сравнения Kandinsky 6.0 Image Pro с другими моделями. Первое число над каждым столбцом — доля побед Kandinsky.

Также к релизу новой модели мы интегрировали механизм Image RAG: при запросе пользователя осуществляется поиск в базе знаний и, при необходимости, добавление релевантных изображений в контекст. Благодаря этому значительно выросло знание тонкостей отечественного культурного кода, и, кроме того, появилась возможность постоянно расширять и актуализировать знания модели без полного её переобучения. Причем Image RAG работает не только в режиме генерации по тексту, но и в режиме редактирования — можно сгенерировать себя, например, с любимым киногероем:

Схема Image RAG

Схема Image RAG

База знаний постоянно пополняется как актуальными объектами, персонажами и стилями, так и тщательно отобранными референсами объектов национальной культуры, благодаря чему корректно генерируются, например, мезенская роспись:

"Белая глиняная кружка с мезенской росписью"

«Белая глиняная кружка с мезенской росписью»

Или картуз:

«Паренёк в картузе едет на велосипеде»

«Паренёк в картузе едет на велосипеде»

Примеры и сценарии применений

Kandinsky 6.0 Image Pro поддерживает все основные виды редактирования изображений, выполняя их с высоким уровнем качества. Например, сложные виды удаления объектов и надписей, с сохранением консистентности:

«Паренек в картузе едет на велосипеде»

«Убери граффити и надписи на стене»

Замену объектов, причём с учётом стиля изображения:

«Убери граффити и надписи на стене»

«Замени яблоко на банан»

Стилизацию фото человека с сохранением черт лица:

«Замени яблоко на банан»

«Перерисуй в стиле рисунка цветными карандашами»

И не обязательно человека:

«Перерисуй в стиле рисунка цветными карандашами»

«Сделай в стиле мягкой игрушки»

Отлично работает реставрация и колоризация старинных фотографий:

«Сделай в стиле мягкой игрушки»

Кстати Kandinsky интегрирован в сервис «Бессмертный полк онлайн», где он помогает восстанавливать архивные фото ветеранов ВОВ.

Одним промтом можно создавать дизайн экстерьеров и фасадов зданий:

"Сделай фасады всех зданий в современном стиле, из стекла. Сделай ландшафтный дизайн, деревья, освещение , парковая зона. Вечернее время."

«Сделай фасады всех зданий в современном стиле, из стекла. Сделай ландшафтный дизайн, деревья, освещение, парковая зона. Вечернее время.»

Или создать интерьер по схеме помещения:

«Сделай фасады всех зданий в современном стиле, из стекла. Сделай ландшафтный дизайн, деревья, освещение, парковая зона. Вечернее время.»

«Фотореалистичный интерьер гостиничной спальни, строго соответствующий предоставленному чертежу.»

Применений новой модели множество: меняйте фон, освещение, прическу или макияж, примеряйте одежду, добавляйте и удаляйте надписи, управляйте выражением лица или фигурой человека на фото. Пробуйте и находите новые новые идеи с Kandinsky 6.0 Image Pro на всех площадках GigaChat: в Telegram, мессенджере Max, на сайте giga.chat, а также в Android‑приложении. Кстати в ближайшее время на всех поверхностях станет доступно редактирование по 3 референсам, а также появится функция детального редактирования – можно будет с помощью специальной кисти показать модели, куда именно добавить новый объект или, наоборот, что именно удалить с картинки, прям вот так:

"Добавь сюда подушку и столик"

“Добавь сюда подушку и столик”

Так что следите за обновлениями, с наступающими майскими праздниками и крутых вам генераций! ✨✨✨

Автор: nikgerasimenko

Источник