- BrainTools - https://www.braintools.ru -

Топ ошибок при генерации текстов и изображений с ИИ

Топ ошибок при генерации текстов и изображений с ИИ - 1

Если вы хоть раз пробовали серьезно работать с ChatGPT или Midjourney, вы знаете это чувство легкого разочарования. Нет, не когда нейросеть тупит и пишет полный бред, это как раз нормально. А когда ты потратил 40 минут, подобрал идеальные формулировки, а на выходе получил какую-то чушь с тремя левыми руками и текстом, где Россия написал через два Ы.

Самое обидное, что в 90% случаев проблема не в нейросети, а в нас. Вернее, в том, как мы с ней разговариваем.

Я сама прошла этот путь. Когда только начинала, мои промпты выглядели как заклинания начинающего волшебника: «Сделай красиво, ну пожалуйста». Но красиво не получалось, вообще ничего не получалось. Зато я стала экспертом по генерации мутантов с шестью пальцами и текстам, от которых хочется зарыдать и уйти в монастырь.

Сейчас, спустя сотни часов экспериментов и несколько тысяч сгенерированных картинок, я составила список самых частых ошибок. Тех, которые реально мешают получить результат и заставляют платить, или ждать, снова и снова.

В этой статье разберем 10 главных ошибок при работе с ИИ:

  • 5 про тексты (где ChatGPT и его братья пишут ерунду)

  • 5 про картинки (где Midjourney и Kandinsky творят черти что)

Поехали разбираться. Приятного прочтения!

Почему ChatGPT пишет ерунду? 5 текстовых ошибок, которые вы совершаете

Работать я буду на платформе BotHub [1]– там собраны и языковые модели (ChatGPT 4o, Claude 3.5, GigaChat), и генераторы картинок (Midjourney, Kandinsky, FLUX). Удобно, когда всё в одном окне и не надо прыгать по десятку вкладок с разными аккаунтами. А по ссылке [2] вы можете получить 300 000 капсов для первых задач. Кстати, Gemini 3.1 pro также уже доступна на сайте, с ней и буду работать.

Но ошибки [3], которые мы разберем, универсальны. Хотите вы тыкать кнопки в BotHub, в официальном интерфейсе OpenAI или в телеграм-боте – суть одна и та же.

Промпт как молитва

Вы пишете нейросети что-то вроде “Напиши хорошую статью про маркетинг” или “Сделай крутой пост для Instagram” и ждете шедевр. Потом смотрите на результат, вздыхаете и думаете: “Ну, ИИ – это просто тупой калькулятор, ничего толкового не выдает”.

Но вот в чем проблема – нейросеть не понимает, чего вы хотите. Какой длины должен быть текст? Для кого писать? В каком стиле? С какой целью?

И вместо того, чтобы уточнить (нейросети пока не умеют вежливо переспрашивать), она просто берет среднее арифметическое по всем текстам про маркетинг, которые видела в обучающей выборке. Получается серость и вода.

Плохой промпт:

Напиши пост про нейросети

Хороший промт: 

Топ ошибок при генерации текстов и изображений с ИИ - 2

Разница в деньгах и времени. С первым промптом вы получите текст через 10 секунд, потратите 20 минут на переписывание и в итоге выкинете. Со вторым через 20 секунд у вас на руках 90% готового материала, который можно сразу публиковать или править по мелочи.

Короткая формула хорошего промпта: Роль + Контекст + Задача + Формат + Ограничения

  • Роль. “Ты эксперт по маркетингу”

  • Контекст. “Мы запускаем новый продукт для пенсионеров”

  • Задача. “Напиши 5 идей для постов”

  • Формат. “Короткие абзацы, эмодзи через каждые 3 предложения”

  • Ограничения. “Не используй канцелярит, максимум 500 знаков”

Слепая вера в галлюцинации

Вы просите ChatGPT найти статистику, дать ссылку на исследование или написать биографию известного человека. Нейросеть бойко выдает красивый текст с цифрами, именами и датами. Вы копируете это в статью или отчет. А потом выясняется, что профессор Иванов, на которого ссылается нейросеть, никогда не существовал, а статистика взята с потолка.

У языковых моделей есть одна противная особенность – они не знают фразы не знаю. 

Если спросить человека “Какая была погода 15 марта 1874 года в Санкт-Петербурге?”, нормальный человек скажет: “Понятия не имею, я тогда не жил”. Нейросеть скажет: “15 марта 1874 года в Санкт-Петербурге было облачно, температура днем +3 градуса, ночью заморозки до -2, осадков не наблюдалось”. И добавит для убедительности ссылку на архив Пулковской обсерватории.

Проблема в том, что этой ссылки не существует. И погоды такой не было. Нейросеть просто дорисовала картинку, потому что ей нужно было выдать связный текст, а правда – дело десятое. В мире ИИ это называется галлюцинации. И лечатся они проверкой.

Плохой подход:

Дай 5 фактов об истории Google

(и дальше использовать эти факты как истину в последней инстанции)

Хороший подход:

Топ ошибок при генерации текстов и изображений с ИИ - 3

Для лучшего результата я включила режим поиска в интернете. Нейросеть действительно сходила на сайты и принесла ссылки, а не выдумала их.

Есть простое правило, которое спасет вас от позора: любой факт, который может вас скомпрометировать, нужно проверять в двух независимых источниках.

  • Дата основания компании – можно проверить быстро

  • Цитата известного человека – лучше найти оригинал

  • Статистика продаж – только официальные отчеты

  • Научные данные – только по ссылкам на исследования

Нейросеть – это генератор правдоподобного текста. Она умеет красиво врать так, что отличить от правды может только человек с критическим мышлением [4].

Знаете, как отличить оптимиста от пессимиста? Оптимист считает, что мы живем в лучшем из миров. Пессимист боится, что это правда.

Так вот, с нейросетями то же самое. Оптимист верит, что ИИ скоро заменит людей. Пессимист проверяет факты и боится, что однажды поверит нейросети на слово.

Синдром ChatGPT-стиля

Вы читаете текст и уже через три предложения понимаете, что это писала нейросеть. Эти слащавые обороты, эта безупречная вежливость, эти переходы “в современном мире”, “стоит отметить, что”, “давайте рассмотрим подробнее”. Текст вроде грамотный, но от него веет такой тоской, что хочется закрыть вкладку.

У языковых моделей есть любимые слова и конструкции. Они не виноваты, просто их так обучили. В обучающей выборке полно корпоративных документов, статей с SEO-оптимизацией и официальных писем. Оттуда нейросеть и нахваталась этой канцелярщины.

Если дать нейросети простой промпт без инструкций по стилю, она включит режим безопасного ответа по умолчанию. А это значит, что никаких резких выражений, никаких разговорных фраз, максимально нейтрально, максимально скучно.

В результате получается текст, который можно использовать для инструкции к стиральной машине, но не для живого блога или рассылки.

Как звучит ChatGPT-стиль:

“В современном мире вопросы эффективного управления временем приобретают особую актуальность. Следует отметить, что многие люди сталкиваются с проблемой нехватки времени. В данной статье мы рассмотрим ключевые аспекты тайм-менеджмента и предложим практические рекомендации по оптимизации рабочего процесса.”

Как должен звучать живой текст:

“Время – единственный ресурс, который не купишь на Ozon. Хорошая новость: им можно научиться управлять. Плохая в том, что большинство способов из интернета – полная ерунда. Давайте разберем три рабочих метода, которые реально помогают, а не просто красиво звучат на вебинарах.”

Чувствуете разницу? Во втором варианте есть автор, есть позиция, есть энергия. Первый вариант можно читать и забывать [5] сразу после прочтения.

Плохой промпт:

Напиши статью про тайм-менеджмент

Хороший промпт:

Топ ошибок при генерации текстов и изображений с ИИ - 4

ChatGPT пишет как идеальный студент, который выучил билет, но ничего не понял. Вроде слова правильные, а ощущение, что разговариваешь с гугл-переводчиком 2010 года, который только что прочитал Достоевского и теперь пытается шутить.

Контекстное голодание

Вы общаетесь с нейросетью как с человеком, который помнит всю вашу жизнь. Написали в первом сообщении “мы продаем детские игрушки ручной работы”. Потом пять сообщений переписывались про дизайн упаковки. А в седьмом сообщении просите написать пост для соцсетей. И нейросеть пишет пост… про дизайн упаковки, хотя вы уже переключились на рекламную кампанию к Новому году.

Или, допустим, вы начинаете новый чат и заново объясняете, кто вы, чем занимаетесь и какой у вас тон общения. Каждый раз, как будто у нейросети склероз.

У языковых моделей действительно есть проблемы с памятью [6], но не такие, как вы думаете. У ChatGPT и аналогичных моделей есть два типа памяти:

  • Контекст окна – то, что модель помнит в рамках текущего диалога (обычно это большой объем, но не бесконечный)

  • Долговременная память [7] – ее практически нет. Закрыв чат, вы для нейросети умрете. В новом чате вы незнакомец.

Но главная проблема не в технических ограничениях, а в том, что мы ленимся повторять [8] важные вводные. Мы думаем: “Ну она же помнит, я же ей уже говорил”. А она не помнит. Или помнит, но в том диалоге, а мы уже новый открыли.

Плохой подход:

(в новом чате) Напиши пост про тюльпаны к 8 Марта

Хороший подход:

Продолжаем работу над проектом цветочного магазина. Напоминаю вводные:

Магазин: “Цветы у дома”, Москва

Аудитория: мужчины 25-45, покупают спонтанно, ценят простоту

Тон: романтичный, но без слащавости, короткие предложения

Что продаем: букеты из роз и пионов, доставка за 2 часа

Теперь задача: напиши пост про тюльпаны к 8 Марта. 

Важно: не теория про цветы, а конкретный призыв купить. И добавь эмодзи, но не переборщи.

Качество ответа нейросети прямо пропорционально количеству контекста, который вы дали перед вопросом. 

Хотите хороший ответ – не жалейте вводных. Расскажите:

  • Кто вы (если это важно)

  • Для кого пишете

  • Что уже сделали по теме

  • Чего хотите добиться

  • Чего делать категорически нельзя

Кстати, в BotHub есть удобная фишка: все диалоги сохраняются на боковой панели, можно экспортировать чаты, группировать и сортировать. Но если вы начинаете новую тему или новый день – лучше повторить вводные. Нейросеть не обидится, ей не лень перечитать. Ей вообще ничего не лень, кроме как отвечать на плохие промпты.

Первый блин комом

Вы попросили нейросеть написать текст. Она выдала ответ. Вы покривились, подумали “ну, сойдет” и начали править руками. Или опубликовали как есть.

При этом вы даже не попробовали сказать волшебную фразу: “А теперь перепиши, но…”

Люди почему-то относятся к нейросети как к эксперту, а не как к инструменту. Мы привыкли, что если человек-копирайтер прислал текст, то переделывать его неудобно. Придется объяснять, торговаться, может быть даже платить сверху. С нейросетью проще. Но почему-то мы по привычке соглашаемся на первый вариант. Хотя могли бы за 2 минуты допилить его до идеала.

Пример, как продолжить диалог:

Это неплохо, но давай попробуем иначе. Сделай начало более цепляющим, можно с вопроса. Добавь 2-3 конкретные цифры или факта. Убери общие фразы типа “высокое качество”. В конце добавь PS с юмором [9]

Или еще проще:

Напиши еще 3 варианта этого же текста, но:

Вариант 1 – дерзкий, для молодежи

Вариант 2 – официальный, для сайта компании

Вариант 3 – смешной, для Telegram-канала

5 причин, почему ваши картинки выглядят как сюрреализм

С текстовыми ошибками разобрались. Если вы дочитали до этого места и узнали себя хотя бы в паре пунктов – уже хорошо. Значит, дальше будете писать промпты осознаннее, проверять факты и не соглашаться на первый попавшийся вариант.

Но, как вы знаете, нейросети умеют не только писать. Они еще и картинки рисуют. И вот тут начинается настоящая вакханалия.

Если в текстах нейросеть хотя пытается казаться умной и серьезной, то в рисовании она часто ведет себя как пьяный художник-сюрреалист. Помните старый анекдот: “Нарисуйте мне слона, только чтобы узнать можно было”? Вот нейросеть слышит примерно так же.

Самое смешное, что ошибки в генерации изображений видны сразу. Их не надо вычитывать, не надо проверять факты. Ты просто смотришь на картинку и думаешь: “Господи, зачем этому коту четыре уха и почему у женщины на портрете рука растет из плеча в обратную сторону?”

В этом блоке разберем пять самых частых ошибок при работе с генераторами картинок. 

Синдром абстрактного художника

Вы пишете в Midjourney или Kandinsky промпт “красивый закат на море”. Получаете что-то размытое, разноцветное и совершенно непригодное для использования. Или нейросеть выдает просто нечто морское, где волны смешались с небом, а солнце похоже на желтое пятно после долгого взгляда на лампочку.

На самом деле проблема в том, что вы попросили художника-импрессиониста нарисовать картину, хотя вам нужна была фотография для сайта.

Генераторы изображений (особенно Midjourney) по умолчанию любят добавлять художественности. Потому что их учили на миллионах картин, фотографий, рисунков. У них нет понятия “просто показать предмет”. У них есть понятие “создать красивое изображение”.

Поэтому, когда вы пишете “красная машина”, нейросеть думает: “О, машина! Надо сделать художественное фото! Добавим боке, размоем фон, сделаем драматичное освещение, пусть будет закат, пусть будут блики!” И вместо фотографии машины для каталога вы получаете постер к фильму “Форсаж 17: Закатное безумие”.

Если вам это и нужно – отлично. Но если вам нужна просто машина для технической документации, тогда вы в пролете.

Плохой промпт (если нужна реалистичная картинка):

красный спортивный автомобиль на дороге

Хороший промт:

Топ ошибок при генерации текстов и изображений с ИИ - 5

Или если вам нужен конкретный стиль:

Топ ошибок при генерации текстов и изображений с ИИ - 6

Мы уточнили параметры изображения. Указали тип (фотография или 3D-рендер), ракурс (вид сбоку), фон (нейтральный серый) и освещение (студийное, ровное). Также можно указать назна��ение изображения – техническая фотография или каталог, чтобы избежать художественных излишеств.

Есть слова, которые гарантированно портят промпт, если вам нужна реалистичная картинка:

Эти слова добавят художественности:

  • атмосферный

  • драматичный

  • эпический

  • красивый

  • художественный

  • в стиле [любой известный художник]

Эти слова, наоборот, приземляют картинку:

  • фотография

  • реалистичный

  • студийное освещение

  • без постобработки

  • технический

  • документальный

  • 8k, 4k (детализация)

Самый простой способ не получить абстракцию – сразу указать жанр:

  • Если нужно фото: “фотография [объекта], снято на камеру Nikon, естественное освещение”

  • Если нужен рисунок: “рисунок от руки, карандаш, скетч”

  • Если нужна графика: “векторная графика, плоский дизайн, чистые линии”

  • Если нужен 3D: “3d-рендер, blender, Cinema 4d, окклюзия”

Нейросеть любит конкретику. Скажите ей, в каком жанре работать, и она перестанет импровизировать.

Анатомический кошмар

Вы просите нейросеть нарисовать человека. Получаете красивое лицо, отличный фон, сочные цвета. А потом замечаете, что у человека шесть пальцев на руке. Или три ноги. Или руки растут из плеч под неестественным углом. Или глаза смотрят в разные стороны, как у хамелеона.

Нейросети правда плохо понимают анатомию человека. И на это есть две причины:

  • Обучающая выборка. Нейросеть смотрела миллионы фотографий и картин. На фотографиях люди обычно стоят ровно, руки не заламывают, пальцы не скрещивают. Но! На фотографиях пальцы часто частично закрыты, сжаты в кулак, спрятаны за предметы. Нейросеть видела миллион рук, но так и не поняла до конца, как устроен этот механизм.

  • Нейросеть рисует то, что правдоподобно выглядит на маленьком масштабе. Пока вы смотрите на всю картинку, рука кажется нормальной. Как только приближаете – начинается треш. Потому что нейросеть не просчитывает анатомию, она просто дорисовывает пиксели так, чтобы было похоже на руку в целом.

Есть несколько вещей, которые нейросеть регулярно делает не так. Пальцы могут быть в количестве 4, 6 или 7, а также расти из других пальцев или располагаться со всех сторон ладони. Руки также могут быть нарисованы неправильно: локти могут гнуться в обратную сторону, кисти прикрепляться прямо к плечу, а у одного человека может быть три руки.

Глаза на изображениях часто имеют разные размеры и разрез, а также могут смотреть в разные стороны. Забавно, когда глаза направлены на зрителя, а голова повернута в профиль.

Ноги также могут быть изображены некорректно: колени могут быть направлены назад, у одного человека может быть три ноги, а ноги могут расти из одного места. Кроме того, при изображении улыбки зубы могут располагаться в несколько рядов, как у акулы.

Плохой промпт:

портрет красивой девушки, улыбается, руки на столе

Хороший промпт:

Топ ошибок при генерации текстов и изображений с ИИ - 7

Но даже с таким промптом нейросеть может накосячить. Просто шансов меньше.

В Midjourney есть специальные ключи, параметры, которые включают режим зануды. Они заставляют нейросеть внимательнее следить за анатомией.

Добавьте в конец промпта:

–no deformed hands, extra fingers, bad anatomy, mutation

Это отрицательный промпт, то есть то, чего НЕ должно быть на картинке.

В Kandinsky и других генераторах тоже есть поле для негативного промпта. Всегда заполняйте его примерно так:

искаженные руки, лишние пальцы, плохая анатомия, мутации, уродство

Если вам нужен человек, но руки не принципиальны, тогда обрежьте их. 

Промпт:

портрет мужчины, по пояс, руки скрещены на груди или в карманах

Чем меньше нейросети приходится рисовать сложных деталей, тем меньше шансов, что она накосячит. Не надо проверять нейросеть на прочность, заставляя ее рисовать ладонь с растопыренными пальцами. Это для нее сложнее, чем для вас написать диктант на китайском.

В Midjourney можно кинуть ссылку на фотографию человека с нормальной анатомией и попросить сделать похожее. Шансы на успех резко растут. Нейросеть попытается повторить позу и пропорции. Не идеально, но лучше, чем с нуля.

Текст как заклинание

Вам нужна картинка с надписью. Например, обложка для статьи “5 способов заработать” или меню для кофейни. Вы пишете в промпте: “вывеска с текстом Fresh Coffee”. Нейросеть рисует красивое кафе, стильную вывеску, а на ней… каракули, похожие на буквы, но не читаемые. Или буквы есть, но они складываются в “Frfsh Cofee”. Или вообще иероглифы, хотя вы просили английский.

Вы пробуете снова, уточняете, пишете крупно “ТЕКСТ ДОЛЖЕН БЫТЬ ЧЕТКИМ”. Нейросеть рисует вывеску, где вместо текста – просто полоски, отдаленно напоминающие буквы.

Генераторы изображений не умеют писать текст. Точнее, они умеют рисовать что-то похожее на текст. Для нейросети буквы – это просто набор линий и форм. Она не понимает, что C и O – это разные символы с конкретными значениями. Она просто знает, что на вывесках обычно есть какие-то загогулины, и рисует загогулины.

Почему так? Потому что нейросеть обучалась на миллионах картинок с текстом. Но она не училась читать. Для нее текст – это такая же текстура, как дерево или мрамор. Дерево должно быть похоже на дерево, мрамор – на мрамор, текст – на текст. А что там написано уже не важно.

Есть модели, которые справляются с текстом чуть лучше (например, DALL-E 3, Ideogram, FLUX). Но даже они ошибаются в длинных словах, путают похожие буквы (I и l, O и 0), не могут написать больше пары слов без ошибок, пишут на английском, даже если вы просили русский (потому что в обучающей выборке больше английского).

Плохой промпт:

меню для кофейни, наверху написано “COFFEE MENU”, красивый шрифт

Есть три способа решить проблему с текстом. Выбирайте под задачу.

Способ 1. Не просить текст у нейросети

Самый надежный вариант. Генерируете картинку без текста, а потом накладываете надпись в Photoshop, Canva или любом редакторе.

Промпт:

красивое меню для кофейни, деревянная доска, меловой фон, пустое место для текста сверху, стиль hand-made

Способ 2. Очень короткий текст

Если текст нужен прямо на картинке и редактировать потом неудобно, ограничьтесь одним-двумя словами. И выбирайте простые слова.

Промт:

вывеска на двери, написано “OPEN”, крупно, деревянная табличка, красивый шрифт, четкие буквы.

Топ ошибок при генерации текстов и изображений с ИИ - 8

Способ 3. Специализированные инструменты

Есть нейросети, которые специально обучали для работы с текстом. Например:

  • Ideogram – неплохо пишет короткие тексты

  • FLUX Pro – тоже справляется лучше среднего

  • DALL-E 3 – в OpenAI поднажали на тексты, но все равно ошибается

В BotHub на выбор есть все эти модели. Если вам нужен текст, выбирайте ту, которая лучше с ним работает. Но даже с ними не рискуйте сложными фразами.

Игнорирование пропорций и композиции

Вы просите нейросеть нарисовать красивый интерьер гостиной. Получаете картинку, где диван занимает 80% пространства, а остальная комната просто не влезла. Или просите портрет кота, а кот настолько крупно, что видны только усы и нос, уши обрезаны краем кадра.

Второй вариант. Вы просите здание офиса, а нейросеть рисует небоскреб, который упирается в верхнюю границу и обрезан, или наоборот, здание такое маленькое, что вокруг него пустота на пол картинки.

Дело в том, что нейросеть не чувствует границ кадра. Она рисует объект, но не думает о том, как он впишется в прямоугольник, который вы потом увидите. Для нейросети важно нарисовать диван максимально детально, а то, что он не влез целиком – проблемы кадрирования.

Это происходит потому, что нейросеть обучалась на картинках, которые уже были обрезаны. Она видела миллион фотографий диванов, но на них диваны всегда были целиком или всегда были частью интерьера. Нейросеть не понимает, что такое полноразмерный объект в кадре – она просто рисует диван и заполняет им доступное пространство.

Отдельная боль [10] – соотношение сторон. Если вы не укажете –ar в Midjourney или не выберете формат в другом генераторе, нейросеть выдаст картинку в пропорциях, на которые ее натренировали. Обычно это 1:1 (квадрат) или 16:9 (широкий формат).

Но если вам нужен вертикальный формат для сторис или поста в Instagram, а вы его не указали, нейросеть просто обрежет картинку или впишет объект в квадрат, оставив пустоту сверху и снизу.

Плохой промпт (без указания формата и композиции):

красивый особняк, архитектура, современный стиль

Как надо:

В Midjourney это делается параметром –ar:

красивый особняк, архитектура, современный стиль –ar 16:9

(для широкоформатного изображения)

красивый особняк, архитектура, современный стиль –ar 2:3

(для вертикального формата, как в сторис)

В Kandinsky и других генераторах обычно есть выпадающий список с пропорциями. Не ленитесь его выбирать.

Мало указать формат. Надо сказать, что именно должно быть в кадре.

Топ ошибок при генерации текстов и изображений с ИИ - 9

Чтобы нейросеть не обрезала важное, используйте эти фразы:

  • целиком в кадре

  • полностью виден

  • без обрезания

  • с расстояния

  • общий план

  • архитектурная съемка (для зданий)

  • портретная съемка (для людей – обычно оставляет пространство вокруг)

Если нейросеть упорно режет объекты, скажите ей, что нельзя обрезать.

Промпт:

портрет девушки, поясной портрет, голова не обрезана сверху, руки полностью в кадре, правильное кадрирование

В Midjourney можно добавить в негативный промт:

–no cropped, cut off, framing issues

Кстати, про negative prompts. В Midjourney через –no можно запрещать не только анатомические косяки, но и проблемы с композицией.

интерьер гостиной, диван, журнальный столик –no cropped, cut off

Неправильная композиция убивает картинку так же сильно, как кривые руки. Особенно обидно, когда нейросеть нарисовала красивое здание, но обрезала шпиль или крышу. Картинка становится непригодной для использования, вставить ее в презентацию или на сайт уже не получится, будет выглядеть как любительская фотография с кривыми руками.

Стилевая каша

Вы просите нейросеть нарисовать логотип в современном стиле. Получаете картинку, где смешаны неоновые цвета, винтажные элементы, 3D-шрифты и текстура под старину. Вроде каждая деталь по отдельности красивая, но вместе получается какая-то какофония.

Нейросеть не чувствует стилевого единства. Для нее стиль – это просто набор визуальных признаков, которые часто встречаются вместе. Но если вы не ограничиваете ее жестко, она начинает комбинировать всё, что знает, чтобы сделать картинку богаче и интереснее.

Плохой промпт (слишком общий):

логотип для кофейни, стильный, современный

Как надо:

Шаг 1. Ограничиваем стиль до одного

Выберите один стиль и придерживайтесь его. Не надейтесь, что нейросеть сама догадается, что современный и винтажный не дружат.

Топ ошибок при генерации текстов и изображений с ИИ - 10

или

логотип для кофейни, винтажный стиль, ретро 1950-х, потертая текстура, приглушенные цвета, рисованный шрифт

Шаг 2. Запрещаем лишнее

Используйте негативные промты, чтобы нейросеть не улетала в фантазии.

В Midjourney:

логотип для кофейни, минимализм, плоский дизайн –no 3d, neon, gradient, texture, multiple colors, background

В Kandinsky и других генераторах заполните поле негативного промпта:

3d, неон, градиент, текстура, много цветов, сложный фон, лишние детали

Шаг 3: Указываем цветовую палитру

Если не хотите радугу, скажите точно, какие цвета можно использовать.

Хорошо:

логотип для кофейни, только оттенки коричневого и бежевого, акцент темно-коричневый, минимализм

Нейросеть не будет добавлять синий, зеленый и розовый, потому что вы запретили.

Если вам нужно несколько элементов в одном стиле, генерируйте их отдельно. Хотите логотип, визитку и упаковку в едином стиле? Сгенерируйте логотип, потом визитку с отсылкой к логотипу, потом упаковку.

Стилевая каша делает картинку непрофессиональной. Логотип должен быть простым и запоминающимся. Интерьер должен выдерживать одну стилистику. Обложка – передавать одно настроение.

Когда нейросеть мешает всё подряд, получается визуальный шум. Такую картинку сложно использовать в брендинге, сложно продать, сложно объяснить, почему она выглядит именно так.

Какой итог?

Мы разобрали 10 ошибок. Пять текстовых, пять визуальных. Много букв, много примеров. Но в работе, когда вы сидите перед экраном и вам нужно быстро сгенерировать контент, вся эта теория вылетает из головы.

Поэтому краткая памятка для вас. Прогоняйте по ней каждый промпт перед отправкой.

Текстовые промпты 

До отправки проверьте:

Контекст – нейросеть знает, кто я, для кого пишу и зачем?

Роль – я сказал, кем она должна себя представить?

Формат – я указал длину, структуру, тон?

Запреты – я перечислил, чего делать нельзя?

Примеры – я показал, как должно выглядеть?

Факты – я собираюсь перепроверить цифры и имена?

Итерации – я готов попросить переписать 2-3 раза?

После получения проверьте:

Стиль – это похоже на живого человека или на бездушный реферат?

Вода – можно ли сократить на 30% без потери смысла?

Факты – я проверил ссылки и статистику?

Цель – текст решает ту задачу, которую я ставил?

Визуальные промпты

До отправки проверьте:

Соотношение сторон – я указал –ar или выбрал формат?

Стиль – я выбрал один стиль или надеюсь, что нейросеть сама разберется?

Цвета – я ограничил палитру или разрешил радугу?

Композиция – я сказал, что объект должен быть целиком в кадре?

Текст – я точно хочу, чтобы нейросеть писала буквы? (лучше не надо)

Негативные промты – я запретил кривые руки, лишние пальцы и прочие мутации?

После получения проверьте:

Анатомия – сколько пальцев? глаза смотрят в одну сторону?

Композиция – ничего не обрезано важного?

Текст – если есть надписи, они читаются?

Стиль – это один стиль или винегрет?

Детали – предметы не сливаются друг с другом?

Все ошибки, которые мы разобрали, происходят не потому, что нейросеть тупая. А потому, что мы ленимся объяснить. Ленимся добавить контекст. Ленимся уточнить стиль. Ленимся проверить факты. Ленимся попросить переделать.  А нейросеть готова переписывать текст 500 раз. 

Три главных вывода из всей статьи:

  • Конкретика на 1 месте. Не “сделай красиво”, а “сделай вот так, вот столько, вот в таком стиле”.

  • Нейросеть врет. Проверяйте факты, даже если она звучит убедительно.

  • Первая версия – не последняя. Дожимайте, уточняйте, просите переделать. Лучший результат получается с 3-4 попытки.

А с какими ошибками сталкивались вы? Делитесь в комментариях. И спасибо за прочтение!

Автор: mefdayy

Источник [11]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/26418

URLs in this post:

[1] BotHub : https://bothub.chat/?utm_source=contentmarketing&utm_medium=habr&utm_campaign=news&utm_content=TOP_ERRORS_WHEN_GENERATING_TEXTS_AND_IMAGES_WITH_AI

[2] по ссылке: https://bothub.chat/?invitedBy=iTNi-351UcHgc1BxGFWim

[3] ошибки: http://www.braintools.ru/article/4192

[4] мышлением: http://www.braintools.ru/thinking

[5] забывать: http://www.braintools.ru/article/333

[6] памятью: http://www.braintools.ru/article/4140

[7] Долговременная память: http://www.braintools.ru/article/9500

[8] повторять: http://www.braintools.ru/article/4012

[9] юмором: http://www.braintools.ru/article/3517

[10] боль: http://www.braintools.ru/article/9901

[11] Источник: https://habr.com/ru/companies/bothub/articles/1005258/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1005258

www.BrainTools.ru

Rambler's Top100