- BrainTools - https://www.braintools.ru -

Вы когда-нибудь получали от нейросети изображение, которое хочется сразу удалить и сделать вид, что этого не было? Допустим, вы открыли Midjourney, DALL-E или Kandinsky. Пишете: “нарисуй красивого кота”. ИИ выдает что-то с тремя хвостами, шестью глазами и текстурой мокрой тряпки. Знакомо?
Нейросети для генерации изображений – отличные исполнители, но ужасные телепаты [1]. Они не знают, что значит красиво, атмосферно или немного грустно. Им нужны конкретные слова: тип освещения, угол съемки, материалы, стиль художника. И даже порядок этих слов имеет значение. Да, они капризные, как заказчик, который не знает, чего хочет, но “это точно не то”.
В этой статье мы соберем четкую инструкцию о том, как разговаривать с ИИ на его языке, основываясь только на конкретных приемах: структура промпта, вес слов, негативные инструкции и настройки.
Под конец вы сможете превращать кота-уродца в фотореалистичного мейн-куна в золотистом свете, 85 мм, f/1.4. Или в акварельного кота в стиле гравюр XIX века. ИИ перестанет вас бесить. Ну, хотя бы чуть-чуть.
Готовы? Тогда поехали, приятного прочтения!
Представьте, что нейросеть – это очень старательный, но абсолютно буквальный стажер. Вы просите его принеси инструменты, а он приносит всё, включая сломанный степлер.
Чтобы стажер не чудил, инструкцию нужно писать по формуле. Она работает для большинства современных нейросетей: Midjourney, DALL-E 3, Кандинский, Flux, Stable Diffusion.
Главный объект + детали и признаки + окружение + стиль + освещение + ракурс + параметры качества
Начните с того, что в центре кадра.
Плохо: “Красивый закат в горах с одиноким волком и луной”. Нейросеть начнет угадывать, что из этого главное.
Хорошо: “Волк”. Четко, понятно.
Дальше добавляем конкретные признаки: возраст, цвет, материал, текстура, эмоция [2], состояние.
Вместо “старый волк” – Волк, пожилой, серая свалявшаяся шерсть, шрам над левым глазом
Вместо “грустный робот” – Робот, ржавый, один мигающий глаз, печальная поза, сидит один
Прилагательные общего смысла (красивый, интересный, стильный) работают плохо. Конкретные описания (ржавый, с потрескавшейся краской, с опущенными плечами) работают отлично.
Где это происходит? Нейросеть не поймет, пока вы не скажете. А если не сказать, то придумает сама. И это может быть белая пустота или хаотичный шум.
Волк, пожилой, серая свалявшаяся шерсть, стоит на заснеженном утесе ночью
Робот, ржавый, один мигающий глаз, сидит на заброшенной фабрике, разбитые окна, лунный свет
Стиль также очень важная деталь любого промпта для изображения. Это то, что превращает просто волка в волка в стиле аниме, фотореализм или рисунок углем.
Примеры стилей (вставляете прямо в промпт):
|
Что вы хотите |
Что писать |
|---|---|
|
Фотография |
|
|
Акварель |
|
|
Киберпанк |
|
|
Старая фотография |
|
|
Стиль художника |
|
В Midjourney и Stable Diffusion это работает. Но некоторые нейросети (например, свежие версии DALL-E) ограничивают подражание [3] живым художникам. Если не сработало – используйте описание стиля словами (аниме с мягкими пастельными тонами, детализированный фон), а не именем.
Пример:
Волк, пожилой, серая свалявшаяся шерсть, стоит на заснеженном утесе ночью, фотореализм, снято на Sony A7III, 50 мм
Освещение – это половина настроения. Без него картинка плоская.
|
Эффект |
Слова в промпте |
|---|---|
|
Мягкий рассеянный свет |
|
|
Драматичный |
|
|
Закат или рассвет |
|
|
Ночной неон |
|
|
Студийный портрет |
|
Пример:
Волк, пожилой, серая свалявшаяся шерсть, стоит на заснеженном утесе ночью, фотореализм, снято на Sony A7III, 50 мм, кинематографичное освещение, синий лунный свет, длинные тени
Если не указать ракурс, нейросеть выберет самый скучный – анфас, по центру, на уровне глаз.
|
Ракурс |
Когда использовать |
|---|---|
|
|
сделать объект величественным или угрожающим |
|
|
показать масштаб, узор, сцену сверху |
|
|
эмоции [4], детали лица, текстура |
|
|
окружение важнее объекта |
|
|
загадочность, взгляд персонажа |
Финальный пример:
Волк, пожилой, серая свалявшаяся шерсть, стоит на заснеженном утесе ночью, фотореализм, снято на Sony A7III, 50 мм, кинематографичное освещение, синий лунный свет, нижний ракурс, общий план, туман поднимается снизу
В большинстве нейросетей есть специальные параметры, которые не пишутся словами в самом промпте, а добавляются через слеш или отдельные поля.
Для Midjourney:
--ar 16:9 – соотношение сторон
--style raw – отключает встроенную художественную эстетику Midjourney, заставляя модель строже следовать промпту
--stylize 250 (или --s 250) – уровень художественной свободы. Чем выше значение (до 1000), тем красивее, но дальше от задания. Значение по умолчанию – 100
--no текст водяной знак – чего НЕ должно быть (запятые не нужны)
Для DALL-E 3:
Отдельных параметров нет, всё через естественный язык
Можно попросить: без текста, без подписей, без видимых водяных знаков
Важно: OpenAI добавляет в изображения невидимые метаданные (C2PA) и маленькую иконку CR в левом верхнем углу. Это техническая мера для отслеживания происхождения контента
Для Кандинский и Шедеврум:
Соотношение сторон выбирается в интерфейсе
Негативный промпт – отдельное поле, заполняйте обязательно. Не используйте в негативном промпте слова-отрицания вроде «без», «кроме», «не» – нейросеть их не понимает. Пишите только конкретные объекты, которые нужно исключить (люди, машины, подписи)
Для Stable Diffusion:
CFG Scale 5–9 – чем выше, тем точнее промпт, но может быть слишком жёстко. Стандартное значение – 7
Steps 20–30 – больше шагов = детальнее, но дольше. 20 шагов обычно достаточно, 50 – избыточно для большинства задач
Негативный промпт – отдельное поле, используйте всегда
Вы заметили, что все примеры выше написаны на русском. В реальности современные нейросети (Midjourney, DALL-E 3, Flux) отлично понимают русский язык. Можно писать промпты по-русски, и они будут работать.
Но есть тонкость. Большинство обучающих материалов, чек-листов и волшебных слов (например, cinematic lighting, octane render, intricate details) написаны на английском. Более того, некоторые модели (особенно Flux) в неофициальных сервисах показывают более стабильный результат именно на английском из-за особенностей обучающей выборки. Поэтому многие профи всё равно используют английские промпты, просто потому что так больше готовых решений и выше предсказуемость.
Пишите на том языке, на котором вам удобнее. Нейросеть поймёт и так, и так. Главное – это структура и конкретика, а не язык.
Самая частая ошибка [5] новичков – это пытаться запрещать через основной промпт.
Они пишут: «волк, но без лишних лап, не мутант, не страшный, без третьего глаза»
Нейросеть слышит: «волк... лишние лапы... мутант... страшный... третий глаз»
Да, она плохо обрабатывает частицу “не”. Для нее не красный и красный – почти одно и то же. Она просто берет все слова, которые вы написали, и старается их учесть. Поэтому чем больше вы перечисляете того, чего не хотите, тем выше шанс, что это появится.
Решение – негативный промпт (negative prompt). Это отдельное поле или специальная команда, куда вы пишете то, что нужно исключить.
Не все нейросети дают к нему прямой доступ.
|
Нейросеть |
Есть ли негативный промпт |
Как использовать |
|---|---|---|
|
Midjourney |
да |
через параметр |
|
Stable Diffusion |
да |
в интерфейсах Automatic1111, ComfyUI, Kandinsky 3.0 |
|
DALL-E 3 |
нет |
нет прямого поля. Обход: писать в основном промпте |
|
Кандинский 3.0+ |
да |
отдельное поле в интерфейсе |
|
Шедеврум |
нет |
нет, только основной промпт |
|
Flux |
да |
официально поддерживает. Поле |
Если прямого поля нет, тогда просто не пишите того, чего не хотите. Лучше вообще ничего не упоминать, чем писать “не страшный”.
Вот типовой набор, который работает в 80% случаев:
Для любых изображений:
уродливый
деформированный
размытый
плохое качество
водяной знак
подпись
текст
рамка
Для портретов и людей:
лишние пальцы
шесть пальцев
искаженное лицо
странные глаза
неестественная поза
плохая анатомия
Для фотореализма:
рисунок
мультяшный
3D-рендер
пластиковый
фильтр
Для конкретных ситуаций:
если не хотите засветов: передержка, слишком ярко
если не хотите темноты: слишком темно, неосвещенный
если не хотите конкретных объектов: люди, машины, дома (подставьте свое)
Однако негативный промпт – это не волшебная палочка. Если написать слишком много запретов, нейросеть может выдать пустой или мутный результат, игнорировать ваш основной промпт, замедлить генерацию (в некоторых движках).
Золотое правило: не больше 10-15 слов в негативном промпте.
Midjourney хорошо понимает --no, но если запрещать то, что почти никогда не появляется на картинке (например, --no вертолёт в промпте про волка в лесу), эффекта не будет. Дело в том, что --no работает как снижение веса указанных элементов до -0.5 . Если элемент и так крайне маловероятен в данном контексте, запрещать его бессмысленно.
Запрещайте только то, что реально может вылезти само собой: --no лишние лапы, мутант, водяной знак, искажённое лицо.
Теория теорией, но без живых примеров она бесполезна. Разберем три ситуации: портрет, предметка, фантастический сюжет. В каждой покажу, как росла конкретика и менялся результат. Использовать я буду сервис BotHub [6], где можно работать без VPN, платить картами российских банков и выбирать любую популярную модель под вашу конкретную задачу. BotHub предлагает совершенно бесплатно протестировать популярные модели, а по ссылке [7]дарит 300 000 капсов всем первым пользователям.
Плохой промпт (нейросеть гадает):
Девушка, красивая

Рандомная девушка, случайный фон, случайный ракурс, дневной свет, стиль не мультяшный, на этом спасибо, но это, считайте, что повезло.
Лучше, но всё еще плохо:
Портрет девушки, фотореализм, хорошее освещение

Добавили жанр (портрет) и стиль (фотореализм). Уже лучше, но хорошее освещение нейросеть понимает как среднее освещение, как у всех.
Хороший промпт:
Портрет девушки, карие глаза, веснушки на носу, легкая улыбна, длинные русые волосы распущены, фотореализм, снято на Sony A7III, 85 мм, студийный свет, софтбокс слева, отражатель справа, блики в глазах, нейтральный серый фон, крупный план

Появились конкретные черты лица (карие глаза, веснушки), эмоции (легкая улыбка), техника съемки (85 мм, софтбокс, отражатель), фон перестал отвлекать, однако к нему тоже пару вопросов. По факту, если не смотреть на текст, то сложно определить, что на заднем плане.
Дополнительно в негативный промпт (если есть поле):
искаженное лицо, странные глаза, лишние пальцы, неестественная поза, водяной знак, мультяшный, рисунок
Плохой промпт:
Стул

Обычный деревянный стул, как будто из середины 20-го века, опять же есть фон, но придуманный нейросетью, спасибо, что не просто белый.
Лучше, но не то:
Красивый деревянный стул, мягкое освещение

Добавили материал (дерево) и освещение. Но красивый всё еще бесполезен, мягкое освещение слишком размыто. Стул обрезан, ножек не видно. Еще и стоит к нам спинкой.
Хороший промпт:
Винтажный стул середины века, каркас из орехового дерева, сиденье из темно-зеленого велюра, мягкие округлые формы, стоит на паркетном полу у окна, утренний естественный свет, теплые бежевые тона, фотореализм, снято на камеру Hasselblad, 50 мм

Изменили эпоху (середина века), добавили конкретные материалы (орех, велюр), место (у окна, на паркете). Указали время суток и цветовую гамму (утро, бежевые тона).
Негативный промпт:
царапины, потертости, современный стиль, пластик, металл, белый фон, тень на стене
Плохой промпт:
Дракон в горах

Случайный дракон, случайные горы, никакой атмосферы, цвета неестественные. Еще и в виде картины на стене. Полный провал.
Лучше, но мало:
Огромный дракон летит над скалами, закат, эпично

Добавили действие (летит), время суток (закат), настроение (эпично). Но эпично нейросеть не понимает. Но хотя бы теперь дракон не на стене в рамке.
Хороший промпт:
Дракон, старый, чешуя цвета потухшей лавы, левый глаз бельмом, огромные кожистые крылья с разрывами, пролетает над острыми скалами, снизу клубится туман, на заднем плане луна и фиолетовое небо, закат на горизонте, кинематографичное освещение, контровой свет, цветокоррекция как в фильмах Питера Джексона, фотореализм, широкий угол, нижний ракурс, общий план

Дракон получил возраст, фактуру, повреждения (старый, чешуя как лава, шрамы, разрывы на крыльях), появились конкретные элементы среды (луна, туман, фиолетовое небо), киношные приемы (контровой свет, цветокоррекция как у конкретного режиссера), ракурсы (широкий угол, нижний ракурс).
Негативный промпт:
мультяшный, пластиковый, маленький, игрушка, люди, замки, деревни, водяной знак, текст
Как выглядит:
Нарисуй мне очень красивого волка, который стоит на скале, вокруг ночь, звезды, луна, и еще чтобы он выл на луну, и шерсть у него была серая и пушистая, и глаза светились, но не страшно, а красиво, и чтобы стиль был как в Ведьмаке, но не совсем, и вообще сделай эпично, но без крови, ясно?
Нейросеть запутается. Длинные предложения с союзами (и, но, чтобы) она не умеет парсить правильно.
Как исправить:
Разбейте на короткие смысловые блоки через запятые. Без лишних слов. Уберите частицу “не” из основного промпта (она всё равно не работает).
Волк, воет на луну, стоит на скале, серая пушистая шерсть, светящиеся глаза, ночь, звезды, луна, стиль Ведьмак, эпично, без крови
Как выглядит:
Красивый закат, красивое море, красивые пальмы
Нейросеть не знает ваш вкус [8]. Красиво для нее – это усредненная открытка из 2010 года. Размытая, высокая насыщенность, всё в розовых тонах.
Как исправить:
Замените красивый на конкретные описательные слова.
|
Вместо красивый |
Напишите |
|---|---|
|
красивый свет |
|
|
красивые цвета |
|
|
красивая девушка |
|
Как выглядит:
Фотореализм, акварель, киберпанк, старинная гравюра, мультфильм Диснея
Нейросеть попытается смешать всё сразу. Получится каша.
Как исправить:
Выберите один основной стиль. Если нужно смешение – делайте его аккуратно (фотореализм с легким оттенком акварельной текстуры). Или используйте параметр --style raw в Midjourney, чтобы нейросеть меньше интерпретировала.
Как выглядит:
Промпт идеальный, но на картинке всё равно водяной знак, рамка, подпись фотографа, а у человека 6 пальцев.
Как исправить:
Всегда добавляйте базовый негативный промпт, если нейросеть его поддерживает.
водяной знак, рамка, подпись, текст, лишние пальцы, искаженное лицо, неестественная поза
Как выглядит:
Дом на берегу озера
Что получится: дом посередине, вид спереди, уровень глаз, как на любительском фото.
Как исправить:
Всегда указывайте ракурс, если он важен. Даже если кажется, что и так понятно.
Дом на берегу озера, вид сверху, с высоты птичьего полетаилинижний ракурс, с уровня воды
Как выглядит:
Вы пишете промпт для обложки YouTube (16:9) или для сториз Instagram (9:16), но не указываете соотношение сторон. Нейросеть выдает квадрат 1:1.
Как исправить:
Добавляйте параметр --ar в Midjourney или выбирайте соотношение в интерфейсе других нейросетей до генерации.
Для Midjourney:
--ar 16:9 – широкий экран
--ar 9:16 – вертикалка для сториз
--ar 2:3 – портретный формат
По умолчанию Midjourney генерирует квадратные изображения 1:1. Параметр --ar отвечает только за пропорции, а не за качество или размер в пикселях. После генерации можно увеличить изображение с помощью апскейлеров (Subtle или Creative), которые удвоят размер.
Теперь вы знаете, что нейросеть – не телепат, ему нужны четкие инструкции. Главный объект в начале, потом детали, окружение, стиль, освещение, ракурс и технические параметры. Именно в таком порядке.
Частица “не” в основном промпте не работает, а иногда даже вредит. Запрещать нужно через отдельное поле или команду --no, а базовый набор запретов выглядит примерно так: уродливый, лишние пальцы, водяной знак, текст, размытость. И что слово красивый бесполезно – его всегда можно заменить на конкретику. Вместо «красивый свет» написать «мягкий золотистый свет, длинные тени», вместо «красивая девушка» – «правильные черты лица, чистая кожа, естественный макияж».
Промпты – это навык, а не магия. В первый раз получается криво, на пятый – лучше, на десятый вы уже не понимаете, как раньше могли писать “просто кота”. Ведите свой словарь работающих фраз, переписывайте чужие удачные промпты своими словами, чтобы понять логику [9], и смиритесь с тем, что иногда нейросеть тупит без видимой причины. Перегенерируйте пару раз, поменяйте порядок слов, отложите на завтра. Утро вечера мудренее, даже для искусственного интеллекта [10].
Попробуйте прямо сегодня взять любой свой старый промпт и переписать его по формуле из этой статьи. Сравните результат. Разница будет заметна. Удачных генераций и пусть руки на сгенерированных картинках всегда будут с правильным количеством пальцев.
Спасибо за прочтение!
Автор: mefdayy
Источник [11]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/27931
URLs in this post:
[1] телепаты: http://www.braintools.ru/article/4846
[2] эмоция: http://www.braintools.ru/article/9540
[3] подражание: http://www.braintools.ru/article/5584
[4] эмоции: http://www.braintools.ru/article/9387
[5] ошибка: http://www.braintools.ru/article/4192
[6] BotHub: https://bothub.chat/?utm_source=contentmarketing&utm_medium=habr&utm_campaign=news&utm_content=PROMPTS_FOR_GENERATING_IMAGES:_HOW_TO_FORMULATE_INSTRUCTIONS_FOR_AI_CORRECTLY
[7] по ссылке : https://bothub.chat/?invitedBy=iTNi-351UcHgc1BxGFWim
[8] вкус: http://www.braintools.ru/article/6291
[9] логику: http://www.braintools.ru/article/7640
[10] интеллекта: http://www.braintools.ru/article/7605
[11] Источник: https://habr.com/ru/companies/bothub/articles/1016520/?utm_campaign=1016520&utm_source=habrahabr&utm_medium=rss
Нажмите здесь для печати.