Промпты для генерации изображений: как правильно сформулировать инструкцию для ИИ

Вы когда-нибудь получали от нейросети изображение, которое хочется сразу удалить и сделать вид, что этого не было? Допустим, вы открыли Midjourney, DALL-E или Kandinsky. Пишете: “нарисуй красивого кота”. ИИ выдает что-то с тремя хвостами, шестью глазами и текстурой мокрой тряпки. Знакомо?

Нейросети для генерации изображений – отличные исполнители, но ужасные телепаты ^[1]. Они не знают, что значит красиво, атмосферно или немного грустно. Им нужны конкретные слова: тип освещения, угол съемки, материалы, стиль художника. И даже порядок этих слов имеет значение. Да, они капризные, как заказчик, который не знает, чего хочет, но “это точно не то”.

В этой статье мы соберем четкую инструкцию о том, как разговаривать с ИИ на его языке, основываясь только на конкретных приемах: структура промпта, вес слов, негативные инструкции и настройки.

Под конец вы сможете превращать кота-уродца в фотореалистичного мейн-куна в золотистом свете, 85 мм, f/1.4. Или в акварельного кота в стиле гравюр XIX века. ИИ перестанет вас бесить. Ну, хотя бы чуть-чуть.

Готовы? Тогда поехали, приятного прочтения!

Анатомия промпта

Представьте, что нейросеть – это очень старательный, но абсолютно буквальный стажер. Вы просите его принеси инструменты, а он приносит всё, включая сломанный степлер.

Чтобы стажер не чудил, инструкцию нужно писать по формуле. Она работает для большинства современных нейросетей: Midjourney, DALL-E 3, Кандинский, Flux, Stable Diffusion.

Главный объект + детали и признаки + окружение + стиль + освещение + ракурс + параметры качества

Начните с того, что в центре кадра.

Плохо: “Красивый закат в горах с одиноким волком и луной”. Нейросеть начнет угадывать, что из этого главное.
Хорошо: “Волк”. Четко, понятно.

Дальше добавляем конкретные признаки: возраст, цвет, материал, текстура, эмоция ^[2], состояние.

Вместо “старый волк” – Волк, пожилой, серая свалявшаяся шерсть, шрам над левым глазом
Вместо “грустный робот” – Робот, ржавый, один мигающий глаз, печальная поза, сидит один

Прилагательные общего смысла (красивый, интересный, стильный) работают плохо. Конкретные описания (ржавый, с потрескавшейся краской, с опущенными плечами) работают отлично.

Где это происходит? Нейросеть не поймет, пока вы не скажете. А если не сказать, то придумает сама. И это может быть белая пустота или хаотичный шум.

Волк, пожилой, серая свалявшаяся шерсть, стоит на заснеженном утесе ночью
Робот, ржавый, один мигающий глаз, сидит на заброшенной фабрике, разбитые окна, лунный свет

Стиль также очень важная деталь любого промпта для изображения. Это то, что превращает просто волка в волка в стиле аниме, фотореализм или рисунок углем.

Примеры стилей (вставляете прямо в промпт):

Что вы хотите	Что писать
Фотография	`фотореализм, снято на Sony A7III, 50 мм`
Акварель	`акварельный рисунок, по-мокрому, мягкие края`
Киберпанк	`киберпанк, неоновые огни, темный переулок, дождь`
Старая фотография	`винтаж, полароид 80-х, зерно, выцветшие цвета`
Стиль художника	`в стиле Хаяо Миядзаки, студия Гибли`

В Midjourney и Stable Diffusion это работает. Но некоторые нейросети (например, свежие версии DALL-E) ограничивают подражание ^[3] живым художникам. Если не сработало – используйте описание стиля словами (аниме с мягкими пастельными тонами, детализированный фон), а не именем.

Пример:

Волк, пожилой, серая свалявшаяся шерсть, стоит на заснеженном утесе ночью, фотореализм, снято на Sony A7III, 50 мм

Освещение – это половина настроения. Без него картинка плоская.

Эффект	Слова в промпте
Мягкий рассеянный свет	`мягкий рассеянный свет, пасмурно`
Драматичный	`кинематографичное освещение, светотень, сильные тени`
Закат или рассвет	`золотой час, теплый оранжевый контровой свет`
Ночной неон	`неоновое освещение, синие и розовые блики, темные тени`
Студийный портрет	`студийный свет, софтбокс, блики в глазах`

Пример:

Волк, пожилой, серая свалявшаяся шерсть, стоит на заснеженном утесе ночью, фотореализм, снято на Sony A7III, 50 мм, кинематографичное освещение, синий лунный свет, длинные тени

Если не указать ракурс, нейросеть выберет самый скучный – анфас, по центру, на уровне глаз.

Ракурс	Когда использовать
`нижний ракурс`	сделать объект величественным или угрожающим
`вид сверху`	показать масштаб, узор, сцену сверху
`крупный план, портрет`	эмоции ^[4], детали лица, текстура
`общий план`	окружение важнее объекта
`со спины, смотрит на...`	загадочность, взгляд персонажа

Финальный пример:

Волк, пожилой, серая свалявшаяся шерсть, стоит на заснеженном утесе ночью, фотореализм, снято на Sony A7III, 50 мм, кинематографичное освещение, синий лунный свет, нижний ракурс, общий план, туман поднимается снизу

Технические параметры (настройки качества)

В большинстве нейросетей есть специальные параметры, которые не пишутся словами в самом промпте, а добавляются через слеш или отдельные поля.

Для Midjourney:

--ar 16:9 – соотношение сторон
--style raw – отключает встроенную художественную эстетику Midjourney, заставляя модель строже следовать промпту
--stylize 250 (или --s 250) – уровень художественной свободы. Чем выше значение (до 1000), тем красивее, но дальше от задания. Значение по умолчанию – 100
--no текст водяной знак – чего НЕ должно быть (запятые не нужны)

Для DALL-E 3:

Отдельных параметров нет, всё через естественный язык
Можно попросить: без текста, без подписей, без видимых водяных знаков
Важно: OpenAI добавляет в изображения невидимые метаданные (C2PA) и маленькую иконку CR в левом верхнем углу. Это техническая мера для отслеживания происхождения контента

Для Кандинский и Шедеврум:

Соотношение сторон выбирается в интерфейсе
Негативный промпт – отдельное поле, заполняйте обязательно. Не используйте в негативном промпте слова-отрицания вроде «без», «кроме», «не» – нейросеть их не понимает. Пишите только конкретные объекты, которые нужно исключить (люди, машины, подписи)

Для Stable Diffusion:

CFG Scale 5–9 – чем выше, тем точнее промпт, но может быть слишком жёстко. Стандартное значение – 7
Steps 20–30 – больше шагов = детальнее, но дольше. 20 шагов обычно достаточно, 50 – избыточно для большинства задач
Негативный промпт – отдельное поле, используйте всегда

Вы заметили, что все примеры выше написаны на русском. В реальности современные нейросети (Midjourney, DALL-E 3, Flux) отлично понимают русский язык. Можно писать промпты по-русски, и они будут работать.

Но есть тонкость. Большинство обучающих материалов, чек-листов и волшебных слов (например, cinematic lighting, octane render, intricate details) написаны на английском. Более того, некоторые модели (особенно Flux) в неофициальных сервисах показывают более стабильный результат именно на английском из-за особенностей обучающей выборки. Поэтому многие профи всё равно используют английские промпты, просто потому что так больше готовых решений и выше предсказуемость.

Пишите на том языке, на котором вам удобнее. Нейросеть поймёт и так, и так. Главное – это структура и конкретика, а не язык.

Негативные промпты. Как объяснить нейросети, чего вы НЕ хотите

Самая частая ошибка ^[5] новичков – это пытаться запрещать через основной промпт.

Они пишут: «волк, но без лишних лап, не мутант, не страшный, без третьего глаза»

Нейросеть слышит: «волк... лишние лапы... мутант... страшный... третий глаз»

Да, она плохо обрабатывает частицу “не”. Для нее не красный и красный – почти одно и то же. Она просто берет все слова, которые вы написали, и старается их учесть. Поэтому чем больше вы перечисляете того, чего не хотите, тем выше шанс, что это появится.

Решение – негативный промпт (negative prompt). Это отдельное поле или специальная команда, куда вы пишете то, что нужно исключить.

Не все нейросети дают к нему прямой доступ.

Нейросеть	Есть ли негативный промпт	Как использовать
Midjourney	да	через параметр `--no`, например: `--no лишние лапы, мутант`
Stable Diffusion	да	в интерфейсах Automatic1111, ComfyUI, Kandinsky 3.0
DALL-E 3	нет	нет прямого поля. Обход: писать в основном промпте `без текста, без подписей` (здесь “без” работает лучше)
Кандинский 3.0+	да	отдельное поле в интерфейсе
Шедеврум	нет	нет, только основной промпт
Flux	да	официально поддерживает. Поле `negative_prompt` в API (например, в UCloud, Replicate)

Если прямого поля нет, тогда просто не пишите того, чего не хотите. Лучше вообще ничего не упоминать, чем писать “не страшный”.

Вот типовой набор, который работает в 80% случаев:

Для любых изображений:

уродливый
деформированный
размытый
плохое качество
водяной знак
подпись
текст
рамка

Для портретов и людей:

лишние пальцы
шесть пальцев
искаженное лицо
странные глаза
неестественная поза
плохая анатомия

Для фотореализма:

рисунок
мультяшный
3D-рендер
пластиковый
фильтр

Для конкретных ситуаций:

если не хотите засветов: передержка, слишком ярко
если не хотите темноты: слишком темно, неосвещенный
если не хотите конкретных объектов: люди, машины, дома (подставьте свое)

Однако негативный промпт – это не волшебная палочка. Если написать слишком много запретов, нейросеть может выдать пустой или мутный результат, игнорировать ваш основной промпт, замедлить генерацию (в некоторых движках).

Золотое правило: не больше 10-15 слов в негативном промпте.

Midjourney хорошо понимает --no, но если запрещать то, что почти никогда не появляется на картинке (например, --no вертолёт в промпте про волка в лесу), эффекта не будет. Дело в том, что --no работает как снижение веса указанных элементов до -0.5 . Если элемент и так крайне маловероятен в данном контексте, запрещать его бессмысленно.

Запрещайте только то, что реально может вылезти само собой: --no лишние лапы, мутант, водяной знак, искажённое лицо.

Практические примеры. Как выглядит эволюция промпта

Теория теорией, но без живых примеров она бесполезна. Разберем три ситуации: портрет, предметка, фантастический сюжет. В каждой покажу, как росла конкретика и менялся результат. Использовать я буду сервис BotHub ^[6], где можно работать без VPN, платить картами российских банков и выбирать любую популярную модель под вашу конкретную задачу. BotHub предлагает совершенно бесплатно протестировать популярные модели, а по ссылке ^[7]дарит 300 000 капсов всем первым пользователям.

Пример 1. Портрет

Плохой промпт (нейросеть гадает):

Девушка, красивая

Промпты для генерации изображений: как правильно сформулировать инструкцию для ИИ - 2

Рандомная девушка, случайный фон, случайный ракурс, дневной свет, стиль не мультяшный, на этом спасибо, но это, считайте, что повезло.

Лучше, но всё еще плохо:

Портрет девушки, фотореализм, хорошее освещение

Промпты для генерации изображений: как правильно сформулировать инструкцию для ИИ - 3

Добавили жанр (портрет) и стиль (фотореализм). Уже лучше, но хорошее освещение нейросеть понимает как среднее освещение, как у всех.

Хороший промпт:

Портрет девушки, карие глаза, веснушки на носу, легкая улыбна, длинные русые волосы распущены, фотореализм, снято на Sony A7III, 85 мм, студийный свет, софтбокс слева, отражатель справа, блики в глазах, нейтральный серый фон, крупный план

Промпты для генерации изображений: как правильно сформулировать инструкцию для ИИ - 4

Появились конкретные черты лица (карие глаза, веснушки), эмоции (легкая улыбка), техника съемки (85 мм, софтбокс, отражатель), фон перестал отвлекать, однако к нему тоже пару вопросов. По факту, если не смотреть на текст, то сложно определить, что на заднем плане.

Дополнительно в негативный промпт (если есть поле):

искаженное лицо, странные глаза, лишние пальцы, неестественная поза, водяной знак, мультяшный, рисунок

Пример 2. Предметка

Плохой промпт:

Стул

Промпты для генерации изображений: как правильно сформулировать инструкцию для ИИ - 5

Обычный деревянный стул, как будто из середины 20-го века, опять же есть фон, но придуманный нейросетью, спасибо, что не просто белый.

Лучше, но не то:

Красивый деревянный стул, мягкое освещение

Промпты для генерации изображений: как правильно сформулировать инструкцию для ИИ - 6

Добавили материал (дерево) и освещение. Но красивый всё еще бесполезен, мягкое освещение слишком размыто. Стул обрезан, ножек не видно. Еще и стоит к нам спинкой.

Хороший промпт:

Винтажный стул середины века, каркас из орехового дерева, сиденье из темно-зеленого велюра, мягкие округлые формы, стоит на паркетном полу у окна, утренний естественный свет, теплые бежевые тона, фотореализм, снято на камеру Hasselblad, 50 мм

Промпты для генерации изображений: как правильно сформулировать инструкцию для ИИ - 7

Изменили эпоху (середина века), добавили конкретные материалы (орех, велюр), место (у окна, на паркете). Указали время суток и цветовую гамму (утро, бежевые тона).

Негативный промпт:

царапины, потертости, современный стиль, пластик, металл, белый фон, тень на стене

Пример 3. Фантастика

Плохой промпт:

Дракон в горах

Промпты для генерации изображений: как правильно сформулировать инструкцию для ИИ - 8

Случайный дракон, случайные горы, никакой атмосферы, цвета неестественные. Еще и в виде картины на стене. Полный провал.

Лучше, но мало:

Огромный дракон летит над скалами, закат, эпично

Промпты для генерации изображений: как правильно сформулировать инструкцию для ИИ - 9

Добавили действие (летит), время суток (закат), настроение (эпично). Но эпично нейросеть не понимает. Но хотя бы теперь дракон не на стене в рамке.

Хороший промпт:

Дракон, старый, чешуя цвета потухшей лавы, левый глаз бельмом, огромные кожистые крылья с разрывами, пролетает над острыми скалами, снизу клубится туман, на заднем плане луна и фиолетовое небо, закат на горизонте, кинематографичное освещение, контровой свет, цветокоррекция как в фильмах Питера Джексона, фотореализм, широкий угол, нижний ракурс, общий план

Промпты для генерации изображений: как правильно сформулировать инструкцию для ИИ - 10

Дракон получил возраст, фактуру, повреждения (старый, чешуя как лава, шрамы, разрывы на крыльях), появились конкретные элементы среды (луна, туман, фиолетовое небо), киношные приемы (контровой свет, цветокоррекция как у конкретного режиссера), ракурсы (широкий угол, нижний ракурс).

Негативный промпт:

мультяшный, пластиковый, маленький, игрушка, люди, замки, деревни, водяной знак, текст

6 типичных ошибок

Ошибка 1. Слишком длинный промпт без структуры

Как выглядит:

Нарисуй мне очень красивого волка, который стоит на скале, вокруг ночь, звезды, луна, и еще чтобы он выл на луну, и шерсть у него была серая и пушистая, и глаза светились, но не страшно, а красиво, и чтобы стиль был как в Ведьмаке, но не совсем, и вообще сделай эпично, но без крови, ясно?

Нейросеть запутается. Длинные предложения с союзами (и, но, чтобы) она не умеет парсить правильно.

Как исправить:
Разбейте на короткие смысловые блоки через запятые. Без лишних слов. Уберите частицу “не” из основного промпта (она всё равно не работает).

Волк, воет на луну, стоит на скале, серая пушистая шерсть, светящиеся глаза, ночь, звезды, луна, стиль Ведьмак, эпично, без крови

Ошибка 2. Упование на слово красивый

Как выглядит:

Красивый закат, красивое море, красивые пальмы

Нейросеть не знает ваш вкус ^[8]. Красиво для нее – это усредненная открытка из 2010 года. Размытая, высокая насыщенность, всё в розовых тонах.

Как исправить:
Замените красивый на конкретные описательные слова.

Вместо красивый	Напишите
красивый свет	`мягкий золотистый свет, длинные тени`
красивые цвета	`бирюзовый и коралловый, высокая насыщенность`
красивая девушка	`правильные черты лица, чистая кожа, естественный макияж`

Ошибка 3. Конфликт стилей внутри одного промпта

Как выглядит:

Фотореализм, акварель, киберпанк, старинная гравюра, мультфильм Диснея

Нейросеть попытается смешать всё сразу. Получится каша.

Как исправить:
Выберите один основной стиль. Если нужно смешение – делайте его аккуратно (фотореализм с легким оттенком акварельной текстуры). Или используйте параметр --style raw в Midjourney, чтобы нейросеть меньше интерпретировала.

Ошибка 4. Забыли про негативный промпт

Как выглядит:
Промпт идеальный, но на картинке всё равно водяной знак, рамка, подпись фотографа, а у человека 6 пальцев.

Как исправить:
Всегда добавляйте базовый негативный промпт, если нейросеть его поддерживает.

водяной знак, рамка, подпись, текст, лишние пальцы, искаженное лицо, неестественная поза

Ошибка 5. Слишком общий ракурс

Как выглядит:

Дом на берегу озера

Что получится: дом посередине, вид спереди, уровень глаз, как на любительском фото.

Как исправить:
Всегда указывайте ракурс, если он важен. Даже если кажется, что и так понятно.

Дом на берегу озера, вид сверху, с высоты птичьего полета или нижний ракурс, с уровня воды

Ошибка 6. Забыли про соотношение сторон

Как выглядит:
Вы пишете промпт для обложки YouTube (16:9) или для сториз Instagram (9:16), но не указываете соотношение сторон. Нейросеть выдает квадрат 1:1.

Как исправить:
Добавляйте параметр --ar в Midjourney или выбирайте соотношение в интерфейсе других нейросетей до генерации.

Для Midjourney:

--ar 16:9 – широкий экран
--ar 9:16 – вертикалка для сториз
--ar 2:3 – портретный формат

По умолчанию Midjourney генерирует квадратные изображения 1:1. Параметр --ar отвечает только за пропорции, а не за качество или размер в пикселях. После генерации можно увеличить изображение с помощью апскейлеров (Subtle или Creative), которые удвоят размер.

Резюмируя

Теперь вы знаете, что нейросеть – не телепат, ему нужны четкие инструкции. Главный объект в начале, потом детали, окружение, стиль, освещение, ракурс и технические параметры. Именно в таком порядке.

Частица “не” в основном промпте не работает, а иногда даже вредит. Запрещать нужно через отдельное поле или команду --no, а базовый набор запретов выглядит примерно так: уродливый, лишние пальцы, водяной знак, текст, размытость. И что слово красивый бесполезно – его всегда можно заменить на конкретику. Вместо «красивый свет» написать «мягкий золотистый свет, длинные тени», вместо «красивая девушка» – «правильные черты лица, чистая кожа, естественный макияж».

Промпты – это навык, а не магия. В первый раз получается криво, на пятый – лучше, на десятый вы уже не понимаете, как раньше могли писать “просто кота”. Ведите свой словарь работающих фраз, переписывайте чужие удачные промпты своими словами, чтобы понять логику ^[9], и смиритесь с тем, что иногда нейросеть тупит без видимой причины. Перегенерируйте пару раз, поменяйте порядок слов, отложите на завтра. Утро вечера мудренее, даже для искусственного интеллекта ^[10].

Попробуйте прямо сегодня взять любой свой старый промпт и переписать его по формуле из этой статьи. Сравните результат. Разница будет заметна. Удачных генераций и пусть руки на сгенерированных картинках всегда будут с правильным количеством пальцев.

Спасибо за прочтение!

Автор: mefdayy

Источник ^[11]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/27931

URLs in this post:

[1] телепаты: http://www.braintools.ru/article/4846

[2] эмоция: http://www.braintools.ru/article/9540

[3] подражание: http://www.braintools.ru/article/5584

[4] эмоции: http://www.braintools.ru/article/9387

[5] ошибка: http://www.braintools.ru/article/4192

[6] BotHub: https://bothub.chat/?utm_source=contentmarketing&utm_medium=habr&utm_campaign=news&utm_content=PROMPTS_FOR_GENERATING_IMAGES:_HOW_TO_FORMULATE_INSTRUCTIONS_FOR_AI_CORRECTLY

[7] по ссылке : https://bothub.chat/?invitedBy=iTNi-351UcHgc1BxGFWim

[8] вкус: http://www.braintools.ru/article/6291

[9] логику: http://www.braintools.ru/article/7640

[10] интеллекта: http://www.braintools.ru/article/7605

[11] Источник: https://habr.com/ru/companies/bothub/articles/1016520/?utm_campaign=1016520&utm_source=habrahabr&utm_medium=rss

Нажмите здесь для печати.