- BrainTools - https://www.braintools.ru -

Удивительно, но “нейрохудожники” появилась не вчера. Оказывается, компьютеры умели генерировать целые картины еще когда в мире бушевал глэм-рок, молодежь страны Советов находила романтику в поездке на БАМ, а жесткий диск со 100 мегабайтами считался эпохальным прорывом технической мысли…
Подрядить компьютер в художники люди стремились уже давно. Чего только стоит эксперимент Десмонда Пола Генри [1], пионера компьютерной графики, который научил суровую аналоговую ЭВМ из переработанных вычислителей бомбовых прицелов рисовать замысловатые узоры прямиком из параллельной реальности.
Вот уж действительно он перековал мечи, только не на орала, а мольберты: движущиеся части бомбонаводителя приводили в движение перо, прижатое к бумаге. Механизм имел несколько степеней свободы и “само‑осциллировал” под действием сервомоторов. Так эхо самой разрушительной войны, которую мы знаем, застыло в немой поэзии экстравагантных абстракций, затем перекочевавших в Windows Media Player.
Кстати говоря, похожим образом на свет появилась и первая компьютерная графика для кино. В 1958 аниматор Джон Уитни “перепилил” прицельный механизм зенитной артиллерии М5, чтобы тот двигал камеры и фиксировал в кадре светящиеся объекты дабы они превращались в психоделическое лазер-шоу. Полученная секвенция [2] была включена в фильм Хичкока “Головокружение” и до сих пор выглядит гипнотически.
Кадры из заставки хичкоковского “Головокружения”/”Vertigo” (1958):



Но абстракции абстракциями, а может ли компьютер нарисовать что-то более осмысленное? А может даже и заменить служителя кисти и холста? Этим вопросом задался лондонский художник Гарольд Коэн (1928 – 2016), ставший в 1971 приглашенным исследователем в стэнфордской Лаборатории искусственного интеллекта [3].
Наблюдая за работой коллег-ИИшников, Коэн озадачивается мыслью: как превратить иррациональное и эфемерное искусство рисунка в код? Он начал с вопроса: “А что делает изображение эмоционально значимым?” и, не будучи даже технарем, попытался формализовать элементарные художественные решения под компьютерную логику [4]: фигуры и фон, замкнутость и незамкнутость линий, симметрии [5], повторения [6],образующие узоры и все остальное.
Чтобы составить понятную систему координат для компьютера, он анализировал детские рисунки, наскальную живопись, схематику древних изображений и собственные абстракции, чтобы выделить базовые “функциональные примитивы” рисунка и затем перенести их в алгоритм. И что интересно, первые работы AARON’а действительно были похожи то ли на детские каракули, то ли на пиктографические символы, оставленные людьми пещерной древности.
Естественно, AARON не был построен на самообучающихся алгоритмах и плоды его творческих мук целиком и полностью зависели от системы правил, заложенных Коэном в фундамент программы. Вот как они приблизительно выглядели с собственной иерархией правил:
Высокий уровень — образы мира: люди, растения, предметы, масштабы, расположение объектов.
Средний уровень — стратегии рисования: как программа должна вести линию, соединять фигуры, заполнять пространство, а также избегать нежелательных, конфликтующих пересечений.
Низкий уровень — геометрические манёвры: кривые, углы, общая сегментация рисунка.
А поскольку учиться на ошибках AARON не умел, править их приходилось Коэну в ручную, каждый раз залезая в код и внося требуемые изменения.
Первые рисунки были крайне простыми монохромными эскизами, не особо постижимыми для маленького человеческого умишки. Но позднее AARON освоил и навык колориста, и более утонченные силуэты под руководством создателя, который внес в код соответствующие инструкции о том как работает композиционная логика цвета и формы.
Первоначально код для программы писался, скорее всего, на Фортране 66, но затем состоялась миграция на С, а уже в 90-х Коэн откроет для себя Lisp:
“В итоге я пришёл к выводу, что в C просто не хватало выразительности, чтобы адекватно представить нечто столь абстрактное, как цвет. И только после того, как я переписал всю программу на Common Lisp — CLOS — я наконец смог увидеть, как можно решить эту проблему.”
А дальше в цитате, дабы продемонстрировать выразительность человеческого языка, он упоминает, что у эскимосов 50 слов для снега. Но при этом, видимо по той же фундаментальной причине, эскимосского Шекспира мир так и не увидел.
Коэн, наверно, первым доказал, что робот может нарисовать если не шедевр, то нечто интересное точно. По мере того как AARON взрослел, взрослело и его искусство: если начинал он буквально с “палка-палка, огуречик”, то уже к 80-м научился рисовать портреты вымышленных людей, которых Коэн никогда не встречал в жизни.
Интересно, что сам художник не воспринимал AARON’а как просто бездушную игрушку. Живший в компактной компьютерной станции Data General Nova, AARON был полноправным ассистентом Коэна, как Кустодиев для Репина. И временами робот сам становился наставником, когда автор с интересом [7] наблюдал за художественной логикой своего маленького детища.
Вот что он сам говорил [8] по этому поводу:
“Очень долгое время я считал, что работы AARON’а должны быть неотличимы от работ живых художников. Сейчас все иначе. Я хочу, чтобы работа выглядела так, будто она создана разумным существом, но при этом не человеком. Теперь я чувствую себя гораздо счастливее, когда программа создает изображение, которое выглядит так, будто его сделал некто или нечто, видящий мир в первый раз. Кто смотрит на него иначе, нежели человек, выросший среди себе подобных.”
И честно говоря, это гораздо более интересный подход, чем мгновенная генерация “пикч” сегодня. Да, это эффектно, часто нужно для дела и даже может поразвлекать, когда есть праздные пять минут. Но уникальность программы Коэна кроется именно в психологической глубине: не просто получить фотографический слепок с реального мира, а увидеть его через призму абсолютно чужого сознания. При чем человеку едва ли понятного.
AARON был не только первой программой, умевшей самостоятельно творить. Еще он наверно самый долгоиграющий софтверный проект в истории, Санта-Барбара от мира кода: Коэн любовно разрабатывал и улучшал свое детище почти 50 лет подряд до самого последнего дня жизни (!)
Выдающегося художника не стало в 2016, всего за год до того, когда на Реддите случится историческое нашествие дипфейков. А через шесть лет мир познакомиться с Midjourney и Stable Diffusion. И посреди жарких баталий о том является ли мазня GenAI искусством или нет, мы увидим, что сбылись пророческие слова Коэна, написанные им в 1982 году:
“Мы постепенно осознаем тот факт, что “интеллект” больше не синонимичен с термином “человеческий разум.”
Автор: DimaIam
Источник [9]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/29452
URLs in this post:
[1] Десмонда Пола Генри: https://en.wikipedia.org/wiki/Desmond_Paul_Henry
[2] Полученная секвенция: https://www.youtube.com/watch?v=SkLn8mamU78
[3] интеллекта: http://www.braintools.ru/article/7605
[4] логику: http://www.braintools.ru/article/7640
[5] симметрии: http://www.braintools.ru/article/3088
[6] повторения: http://www.braintools.ru/article/4012
[7] интересом: http://www.braintools.ru/article/4220
[8] он сам говорил: https://dam.org/museum/essays_ui/essays/the-robotic-artist/
[9] Источник: https://habr.com/ru/companies/studyai/articles/1028564/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1028564
Нажмите здесь для печати.