- BrainTools - https://www.braintools.ru -
В конце прошлого года на конференции AI Journey мы открыли доступ к линейке моделей Kandinsky 5, включая Text‑to‑Image и Image Editing Lite. Сегодня мы представляем масштабное обновление — единую модель генерации и редактирования изображений Kandinsky 6.0 Image Pro. Новая модель работает более качественно и стабильно в задачах генерации изображений по тексту, но особое внимание [1] мы уделили именно задаче редактирования. По результатам сравнений Kandinsky 6.0 Image Pro работает на уровне Flux 2 Max и превосходит GPT Image 1.5. При этом, благодаря переходу к архитектуре MoE, эффективного распараллеливания инференса и оптимизации механизма внимания, модель удалось ускорить более чем на 40% по сравнению с предыдущей версией.
Также к релизу новой модели мы интегрировали механизм Image RAG: при запросе пользователя осуществляется поиск в базе знаний и, при необходимости, добавление релевантных изображений в контекст. Благодаря этому значительно выросло знание тонкостей отечественного культурного кода, и, кроме того, появилась возможность постоянно расширять и актуализировать знания модели без полного её переобучения. Причем Image RAG работает не только в режиме генерации по тексту, но и в режиме редактирования — можно сгенерировать себя, например, с любимым киногероем:
База знаний постоянно пополняется как актуальными объектами, персонажами и стилями, так и тщательно отобранными референсами объектов национальной культуры, благодаря чему корректно генерируются, например, мезенская роспись:
Или картуз:
Kandinsky 6.0 Image Pro поддерживает все основные виды редактирования изображений, выполняя их с высоким уровнем качества. Например, сложные виды удаления объектов и надписей, с сохранением консистентности:
Замену объектов, причём с учётом стиля изображения:
Стилизацию фото человека с сохранением черт лица:
И не обязательно человека:
Отлично работает реставрация и колоризация старинных фотографий:

Кстати Kandinsky интегрирован в сервис «Бессмертный полк онлайн [2]», где он помогает восстанавливать архивные фото ветеранов ВОВ.
Одним промтом можно создавать дизайн экстерьеров и фасадов зданий:
Или создать интерьер по схеме помещения:
Применений новой модели множество: меняйте фон, освещение, прическу или макияж, примеряйте одежду, добавляйте и удаляйте надписи, управляйте выражением лица или фигурой человека на фото. Пробуйте и находите новые новые идеи с Kandinsky 6.0 Image Pro на всех площадках GigaChat: в Telegram [3], мессенджере Max [4], на сайте giga.chat [5], а также в Android [6]‑приложении. Кстати в ближайшее время на всех поверхностях станет доступно редактирование по 3 референсам, а также появится функция детального редактирования – можно будет с помощью специальной кисти показать модели, куда именно добавить новый объект или, наоборот, что именно удалить с картинки, прям вот так:
Так что следите за обновлениями, с наступающими майскими праздниками и крутых вам генераций! ✨✨✨
Автор: nikgerasimenko
Источник [7]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/29519
URLs in this post:
[1] внимание: http://www.braintools.ru/article/7595
[2] Бессмертный полк онлайн: https://2026.polkrf.ru/
[3] Telegram: https://www.ixbt.com/click/?c=53616c7465645f5fc3ff77156d9044b4baa7b136b5c026f07ef88def937c0db3f31d1ad11ac15b6ace8390dbe60dc828bba3c7c2103fcd7326229c4f47b976a2235e068c53f71142a3be524238d04533&h=c0acf7a891689177c900554b0ffccad2b057c95f
[4] Max: https://www.ixbt.com/click/?c=53616c7465645f5f6adcb37bdfe617418ff9d8cdbb3a5352c3bafcd855e7e7c60fb6d7e27d8d069ffaa555bb3b33384207123216d48e3cbc6fbd0bddc2439392&h=7ac3c9949c425ddbca2f4ba27e847e84138c75f3
[5] giga.chat: http://giga.chat
[6] Android: https://www.ixbt.com/click/?c=53616c7465645f5f9efd7d7dcf2867d3717be17a4d7a0f9ee755cda91bb5b41c3d6bad2e958fc8ca801337505c2070eee0ba2e99915b963a2733150227b7264458149ffd73bfe1d7458945ae337de3f2145bd31f66f99ba06dccad82104bc8e4&h=40ff8a056b23aca2fde42724891abc01688fc34b
[7] Источник: https://habr.com/ru/companies/sberbank/articles/1028822/?utm_campaign=1028822&utm_source=habrahabr&utm_medium=rss
Нажмите здесь для печати.