- BrainTools - https://www.braintools.ru -

Kandinsky 6.0 Image Pro — новый уровень редактирования изображений

В конце прошлого года на конференции AI Journey мы открыли доступ к линейке моделей Kandinsky 5, включая Text‑to‑Image и Image Editing Lite. Сегодня мы представляем масштабное обновление — единую модель генерации и редактирования изображений Kandinsky 6.0 Image Pro. Новая модель работает более качественно и стабильно в задачах генерации изображений по тексту, но особое внимание [1] мы уделили именно задаче редактирования. По результатам сравнений Kandinsky 6.0 Image Pro работает на уровне Flux 2 Max и превосходит GPT Image 1.5. При этом, благодаря переходу к архитектуре MoE, эффективного распараллеливания инференса и оптимизации механизма внимания, модель удалось ускорить более чем на 40% по сравнению с предыдущей версией.

Side-By-Side сравнения Kandinsky 6.0 Image Pro с другими моделями. Первое число над каждым столбцом — доля побед Kandinsky.

Side-By-Side сравнения Kandinsky 6.0 Image Pro с другими моделями. Первое число над каждым столбцом — доля побед Kandinsky.

Также к релизу новой модели мы интегрировали механизм Image RAG: при запросе пользователя осуществляется поиск в базе знаний и, при необходимости, добавление релевантных изображений в контекст. Благодаря этому значительно выросло знание тонкостей отечественного культурного кода, и, кроме того, появилась возможность постоянно расширять и актуализировать знания модели без полного её переобучения. Причем Image RAG работает не только в режиме генерации по тексту, но и в режиме редактирования — можно сгенерировать себя, например, с любимым киногероем:

Схема Image RAG

Схема Image RAG

База знаний постоянно пополняется как актуальными объектами, персонажами и стилями, так и тщательно отобранными референсами объектов национальной культуры, благодаря чему корректно генерируются, например, мезенская роспись:

"Белая глиняная кружка с мезенской росписью"

«Белая глиняная кружка с мезенской росписью»

Или картуз:

«Паренёк в картузе едет на велосипеде»

«Паренёк в картузе едет на велосипеде»

Примеры и сценарии применений

Kandinsky 6.0 Image Pro поддерживает все основные виды редактирования изображений, выполняя их с высоким уровнем качества. Например, сложные виды удаления объектов и надписей, с сохранением консистентности:

«Паренек в картузе едет на велосипеде»

«Убери граффити и надписи на стене»

Замену объектов, причём с учётом стиля изображения:

«Убери граффити и надписи на стене»

«Замени яблоко на банан»

Стилизацию фото человека с сохранением черт лица:

«Замени яблоко на банан»

«Перерисуй в стиле рисунка цветными карандашами»

И не обязательно человека:

«Перерисуй в стиле рисунка цветными карандашами»

«Сделай в стиле мягкой игрушки»

Отлично работает реставрация и колоризация старинных фотографий:

«Сделай в стиле мягкой игрушки»

Кстати Kandinsky интегрирован в сервис «Бессмертный полк онлайн [2]», где он помогает восстанавливать архивные фото ветеранов ВОВ.

Одним промтом можно создавать дизайн экстерьеров и фасадов зданий:

"Сделай фасады всех зданий в современном стиле, из стекла. Сделай ландшафтный дизайн, деревья, освещение , парковая зона. Вечернее время."

«Сделай фасады всех зданий в современном стиле, из стекла. Сделай ландшафтный дизайн, деревья, освещение, парковая зона. Вечернее время.»

Или создать интерьер по схеме помещения:

«Сделай фасады всех зданий в современном стиле, из стекла. Сделай ландшафтный дизайн, деревья, освещение, парковая зона. Вечернее время.»

«Фотореалистичный интерьер гостиничной спальни, строго соответствующий предоставленному чертежу.»

Применений новой модели множество: меняйте фон, освещение, прическу или макияж, примеряйте одежду, добавляйте и удаляйте надписи, управляйте выражением лица или фигурой человека на фото. Пробуйте и находите новые новые идеи с Kandinsky 6.0 Image Pro на всех площадках GigaChat: в Telegram [3], мессенджере Max [4], на сайте giga.chat [5], а также в Android [6]‑приложении. Кстати в ближайшее время на всех поверхностях станет доступно редактирование по 3 референсам, а также появится функция детального редактирования – можно будет с помощью специальной кисти показать модели, куда именно добавить новый объект или, наоборот, что именно удалить с картинки, прям вот так:

"Добавь сюда подушку и столик"

“Добавь сюда подушку и столик”

Так что следите за обновлениями, с наступающими майскими праздниками и крутых вам генераций! ✨✨✨

Автор: nikgerasimenko

Источник [7]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/29519

URLs in this post:

[1] внимание: http://www.braintools.ru/article/7595

[2] Бессмертный полк онлайн: https://2026.polkrf.ru/

[3] Telegram: https://www.ixbt.com/click/?c=53616c7465645f5fc3ff77156d9044b4baa7b136b5c026f07ef88def937c0db3f31d1ad11ac15b6ace8390dbe60dc828bba3c7c2103fcd7326229c4f47b976a2235e068c53f71142a3be524238d04533&h=c0acf7a891689177c900554b0ffccad2b057c95f

[4] Max: https://www.ixbt.com/click/?c=53616c7465645f5f6adcb37bdfe617418ff9d8cdbb3a5352c3bafcd855e7e7c60fb6d7e27d8d069ffaa555bb3b33384207123216d48e3cbc6fbd0bddc2439392&h=7ac3c9949c425ddbca2f4ba27e847e84138c75f3

[5] giga.chat: http://giga.chat

[6] Android: https://www.ixbt.com/click/?c=53616c7465645f5f9efd7d7dcf2867d3717be17a4d7a0f9ee755cda91bb5b41c3d6bad2e958fc8ca801337505c2070eee0ba2e99915b963a2733150227b7264458149ffd73bfe1d7458945ae337de3f2145bd31f66f99ba06dccad82104bc8e4&h=40ff8a056b23aca2fde42724891abc01688fc34b

[7] Источник: https://habr.com/ru/companies/sberbank/articles/1028822/?utm_campaign=1028822&utm_source=habrahabr&utm_medium=rss

www.BrainTools.ru

Rambler's Top100