- BrainTools - https://www.braintools.ru -

Главный секрет и принцип хорошей генерации – это последовательность.
Чем точнее проработка отдельных деталей, тем качественнее будет результат.
Как-то намедни баловалась и решила сгенерировать красивую картинку в айдентике нашей компании.
Шаг 0: Нашла прикольный референс на Pinterest (думаю, тоже сгенерированный, но это не точно).

Иду в Gemini и пишу максимально наглый промпт:
«Замени основной цвет на #FF5894 и его оттенки».

Нейросеть возвращает результат в фирменных цветах компании.
Вердикт: Ок, база есть, двигаюсь дальше.
В целом неплохо. Теперь нужно заменить вёдра KFC на наших корпоративных монстриков. Есть у нас в бренд буке такие артефакты как аватары, что-то типа маскотов.
Выглядят они вот так:

Написала промпт:
«Замени вёдра KFC на иконки, которые прикреплены, но сделай их объёмными».

И получаем… ну такое. Иконки, вроде, есть и даже объёмные, но выглядит плоско и нереалистично.
Ошибка [1]: Нейросеть не понимает, КАК именно должен выглядеть объём в этом конкретном контексте
Инсайт: Нельзя попросить нейросеть сделать сложное действие в одном промпте. Нужно разбивать задачу на атомарные операции.
Пишу промпт на английском, потому что так точнее:
«A high-resolution 3D render featuring attached logos designed in the form of a three-dimensional inflatable cushion. The image is fully consistent with the provided reference.
The form is soft, rounded, and slightly flattened; the vibrancy and matte texture of the fabric are clearly visible. The object is presented at a 45-degree angle against a white background, resembling a trendy plush toy. Image aspect ratio: 4:5.»

Результат: какая-то химера.
Так не пойдёт, буду делать каждую иконку отдельно.
Применяю тот же промпт к каждой иконке по очереди.
И вот оно!

Класс, то, что было нужно!
Возвращаюсь к нашему автомату. Прикрепляю:
розовый автомат (из шага 1);
три готовые игрушки (из шага 3.2).
Пишу промпт:
«Replace the KFC buckets with the attached icons; maintain their 3D appearance and have them facing in different directions».
Получаю такой результат:

АЧИШУЕННО!
На этом этапе всё идёт не по плану. Первые попытки выдают странные артефакты.

Но я не сдаюсь!
Промпт, который сработал:
«Remove the KFC logo and replace it with the Atwinta logo. Insert it without altering the background of the machine itself.»
И вот что я получила на выходе:

Ключевая магия здесь: «without altering the background». Без этого нейросеть начинала фантазировать и дорисовывать то, чего не нужно.
Итог: идеальная замена логотипа и фон без изменений.
У меня промелькнула мысль «а что если сделать видос?!».
Иду в Kling.
Прикрепляю картинку и пишу промпт:
«Photorealistic video of a vibrant pink claw machine in action. The mechanical claw arm slowly lowers from the ceiling of the machine, carefully maneuvers above a pile of adorable pink cartoonish robot plush toys, closes its gripper around one plushie, successfully grabs it, and steadily lifts the toy high up into the air. Realistic metal claw mechanics, soft plush textures, glass reflections, realistic shadows and lighting, smooth natural movement, shot on high-end camera, 8K quality, cinematic.»
И вот он, результат)))
А что, если сделать его подлиннее и подинамичнее?!
«Photorealistic video sequence inside a vibrant pink claw machine. First, the shiny metal claw arm descends smoothly from the top, carefully grabs one cute pink robot plush toy from the big pile. It then lifts the toy steadily all the way up to the top of the machine. Once at the top, the claw shifts slightly to the right, opens its metal fingers, and the pink plush robot falls freely downward, tumbling in the air before landing with a soft bounce back onto the pile of other identical pink robot plushies. The fallen toy causes a gentle realistic shift and movement in the pile. Highly detailed plush textures, realistic fabric folds, accurate physics, natural lighting with soft reflections on the glass walls, cinematic camera, 8K, smooth motion, slow-motion on the falling part.»
Наслаждаемся)
Нейросети — это классный инструмент для создания чего угодно. Можно творить с нуля, а можно использовать для трансформации и композитинга.
Главное — делать это последовательно, а не стараться запихать всё в одну кучу.
Вы говорите: «возьми этот автомат → замени цвет → замени объекты внутри → замени логотип → сделай видео».
Тогда получится шедевр, а ни химера)
Автор: tim_kate1010
Источник [2]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/29110
URLs in this post:
[1] Ошибка: http://www.braintools.ru/article/4192
[2] Источник: https://habr.com/ru/articles/1025920/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1025920
Нажмите здесь для печати.