В конце прошлого года на конференции AI Journey мы открыли доступ к линейке моделей Kandinsky 5, включая Text‑to‑Image и Image Editing Lite. Сегодня мы представляем масштабное обновление — единую модель генерации и редактирования изображений Kandinsky 6.0 Image Pro. Новая модель работает более качественно и стабильно в задачах генерации изображений по тексту, но особое внимание мы уделили именно задаче редактирования. По результатам сравнений Kandinsky 6.0 Image Pro работает на уровне Flux 2 Max и превосходит GPT Image 1.5. При этом, благодаря переходу к архитектуре MoE, эффективного распараллеливания инференса и оптимизации механизма внимания, модель удалось ускорить более чем на 40% по сравнению с предыдущей версией.
Также к релизу новой модели мы интегрировали механизм Image RAG: при запросе пользователя осуществляется поиск в базе знаний и, при необходимости, добавление релевантных изображений в контекст. Благодаря этому значительно выросло знание тонкостей отечественного культурного кода, и, кроме того, появилась возможность постоянно расширять и актуализировать знания модели без полного её переобучения. Причем Image RAG работает не только в режиме генерации по тексту, но и в режиме редактирования — можно сгенерировать себя, например, с любимым киногероем:
База знаний постоянно пополняется как актуальными объектами, персонажами и стилями, так и тщательно отобранными референсами объектов национальной культуры, благодаря чему корректно генерируются, например, мезенская роспись:
Или картуз:
Примеры и сценарии применений
Kandinsky 6.0 Image Pro поддерживает все основные виды редактирования изображений, выполняя их с высоким уровнем качества. Например, сложные виды удаления объектов и надписей, с сохранением консистентности:

Замену объектов, причём с учётом стиля изображения:
Стилизацию фото человека с сохранением черт лица:
И не обязательно человека:

Отлично работает реставрация и колоризация старинных фотографий:

Кстати Kandinsky интегрирован в сервис «Бессмертный полк онлайн», где он помогает восстанавливать архивные фото ветеранов ВОВ.
Одним промтом можно создавать дизайн экстерьеров и фасадов зданий:
Или создать интерьер по схеме помещения:
Применений новой модели множество: меняйте фон, освещение, прическу или макияж, примеряйте одежду, добавляйте и удаляйте надписи, управляйте выражением лица или фигурой человека на фото. Пробуйте и находите новые новые идеи с Kandinsky 6.0 Image Pro на всех площадках GigaChat: в Telegram, мессенджере Max, на сайте giga.chat, а также в Android‑приложении. Кстати в ближайшее время на всех поверхностях станет доступно редактирование по 3 референсам, а также появится функция детального редактирования – можно будет с помощью специальной кисти показать модели, куда именно добавить новый объект или, наоборот, что именно удалить с картинки, прям вот так:
Так что следите за обновлениями, с наступающими майскими праздниками и крутых вам генераций! ✨✨✨
Автор: nikgerasimenko


