Как я раздвинул границы фотореализма ИИ и почему я ушел: часть 1

Nov 28 2022
У каждой истории есть свое начало В течение 3-5 месяцев я раздвигал границы в искусстве искусственного интеллекта, используя «фотореалистичные» техники и стиль. Я должен сначала поделиться тем, что я не художник.
Фотореалистичные работы ИИ Кертиса Уайта

У каждой истории есть свое начало

За 3–5 месяцев я раздвинул границы в «фотореалистичных» техниках и стиле искусственного интеллекта. Я должен сначала поделиться тем, что я не художник. Я инженер-программист, возможно, немотивированный технолог, и много изучал рынки. Тем не менее, я практиковал традиционные методы искусства и цифровой живописи в течение примерно 3 лет более 20 лет назад! Я даже немного научился 3D-моделированию.

Мое первое знакомство с искусством было, скорее всего, ранним компьютерным пиксель-артом и цифровым искусством. В какой-то момент я узнал, что большинство замечательных работ в пиксельной графике, которые я ценил, были копиями других великих художников, таких как Борис Вальехо, Сораяма Хадзиме или Джули Белл. Пиксель-арт был очень специфическим и иногда кропотливым навыком, который я ценил, но не проявлял интереса к освоению. Однако это привело к тому, что я стал изучать мастеров-художников, которых они копировали.

У меня даже есть некоторые смутные воспоминания о том, как я общался с такими великими цифровыми художниками, как Крейг Маллинз. Я помню, как он умолял избавиться от пустого белого фона с помощью градиента и наложить на него фигуры. Это была отличная техника для того, кто был столь же опытен, как Маллинз, и нуждался в свободе от удушающих традиционных техник. Но для кого-то без технической сообразительности, как я, я не уверен, что это был правильный подход.

И, действительно, это подводит итог многим моим ранним попыткам. Это была мешанина из различных классических учений и вещей, которые я пытался перенять у других профессионалов. Настоящая проблема заключалась в том, что у меня не было таланта реализовать свое видение. Я совершил еще одну ошибку, когда слишком рано начал пытаться создавать оригинальные работы. Я чувствовал, что если я могу представить себе работу, то, конечно же, я смогу ее создать. Я действительно считаю эту способность видеть или работать над достижением цели в искусстве как ценную — иначе вам просто остается копировать других. Однако, чтобы добиться структурированного прогресса, необходимо иметь почти научный процесс того, как можно достичь желаемого результата. Для любого нового произведения искусства нужно знать, как добиться 80% конечного результата — только 20% должны быть изучены или неизвестны. Вот как я чувствую прогресс.

Итак, в какой-то момент я понял, что не могу достичь своих целей. И, если честно, я узнал кое-что о лучших художниках: они были довольны рисованием и зонированием в течение длительных периодов времени, тогда как мой разум начинал метаться, когда я рисовал. Мне стало скучно или беспокойно, когда я рисовал. Мне нужно было больше интеллектуальной стимуляции, и я переориентировался на рынки, трейдинг и разработку программного обеспечения.

Тем не менее, «баг» для создания мастерских работ все еще оставался на заднем плане.

Хоукер будущего

Немного «жучка», когда я узнал о Далле-2. Я рассказывал всем, кого знал, как AI и ML изменят искусство, торговлю и мир, каким мы его знаем. Но на самом деле я не удосужился попытаться создать какое-либо искусство с использованием новейших технологий искусственного интеллекта. И в какой-то момент меня впечатлила странная дислокация знаний о технологиях будущего и отсутствие у меня опыта: мне нужно получить некоторый опыт работы с этой технологией.

Когда я попытался получить доступ к Dalle-2, я узнал, что он доступен только для избранной группы предварительно отобранных людей. Я не мог получить доступ: однако я узнал о генераторе ИИ под названием «Далле-мини», к которому я тоже мог получить доступ.

Далле-мини

Порталы серии Dalle-mini Кертиса Уайта

Dalle-mini в лучшем случае примерно на 1/1000 мощнее Dalle2. Большинство людей, которые использовали Dalle-mini, использовали его для создания шутливых мемов, таких как фотографии с камеры. Это было довольно ужасно по сравнению с Dalle2.

Сначала я использовал общедоступный сервис, но быстро понял, что мне нужно настроить свой собственный сервер, чтобы иметь возможность генерировать достаточно запусков. Мне потребовалось настроить сервер Linux внутри службы Docker или WSDL. Это не для слабонервных и было проблемой для меня даже с моим сильным техническим образованием.

У Dalle-mini были некоторые преимущества, хотя это было достаточно быстро, всего около 2 минут, чтобы вернуть результат, и, что наиболее важно, бесплатно. Это привело к моему первому серьезному опыту быстрого взлома. В искусстве ИИ вы даете ИИ текстовое описание искусства, которое хотите создать, и он выдает результат. Большую часть времени он выплевывается, как собачья блевотина, но если вы продолжите взламывать, продолжать подсказывать, вы можете начать получать хорошие результаты. Получение отличного результата было связано с серьезными навыками подсказок, а затем позволяло ему генерировать массу изображений, чтобы выбрать лучшие работы.

Вы можете увидеть мою раннюю работу с порталами в начале этого раздела. Dalle-mini создавал изображения с относительно низким разрешением, но я смог добиться лучших результатов, используя алгоритмы искусственного интеллекта с супермасштабированием или повышающей дискретизацией.

Порталы Кертиса Уайта с AI Super Resolution
Изучение персонажа Кертисом Уайтом (Dalle-mini с искусственным интеллектом Super Resolution)

Далле-мини умел создавать наглядные изображения, но чаще всего они были не очень художественными. Обычно он выводит буквальное, неочищенное и часто нехудожественное. Конечно, это не значит, что он не мог создать что-то художественное с серьезным быстрым взломом и запуском моего собственного сервера, но традиционный художник не стал бы терять сон из-за его возможностей.

Ранние работы Disco Diffusion

Ворота Тангейзера, по мотивам «Бегущего по лезвию», Кертис Уайт
Ворота Тангейзера, по мотивам «Бегущего по лезвию», Кертис Уайт

Когда я впервые увидел статью Disco Diffusion, отмеченную в твиттере, я был поражен. Уровень детализации был невероятным! Это было почти слишком много деталей. В отличие от скучных буквальных изображений с низким разрешением, созданных dalle-mini, это была деталь с высоким разрешением, живописная, великолепная. Для Disco Diffusion не существовало государственной службы. И моей видеокарте не хватило памяти. Вместо этого мне пришлось платить за услугу удаленной платформы облачных вычислений ИИ.

Disco Diffusion имеет множество ограничений. Он может хорошо делать живописные работы, но борется с фигурами, животными и фотореализмом. Рендеринг каждого изображения занимает около 30 минут по сравнению с примерно 30 секундами для Dalle2. Быстрый взлом медленнее, но все же критичен. Хотя это и не требуется, многие художники-распространители ссылаются на других художников.

Серия «Черная пантера» Кертиса Уайта (по мотивам Джеральда Брома)

Поддерживая огонь

Fallout и постапокалиптическое искусство Кертиса Уайта

Создание искусства с помощью Disco Diffusion — это серьезная тяжелая работа. Когда я получил хороший быстрый удаленный сервер с поддержкой графического процессора, мне пришлось оставить экземпляр активным, потому что он предназначался только для использования в режиме реального времени. Вы хотите создать достаточно изображений с хорошей подсказкой, чтобы было достаточно работ для выбора нужного изображения, но не так много, чтобы это было расточительно. Обычно требовалось от 25 до 50 поколений за подсказку. У меня часто бывает 2 экземпляра. Все это означает, что вы должны быть готовы к длительным марафонским рабочим сессиям.

В настоящее время я думаю, что может быть полезно объяснить кое-что об искусстве с помощью ИИ и почему я проделал так много работы за такой короткий период времени. Помощь ИИ приводит к экспоненциальному росту и производительности — это как в фильме «Безграничный». Это очень бодрит, даже вызывает привыкание, и приводит к желанию работать усерднее. Не привязываясь к определенному стилю или узкому мотиву, вы также поддерживаете творческие способности человека с беспокойным умом, как я.

Fallout и постапокалиптическое искусство Кертиса Уайта

Традиционный художник должен научиться решать проблемы, характерные для того типа живописи, которую он хочет создать. Выработать уникальный стиль непросто. Художник с искусственным интеллектом может использовать новые стили так часто, как настроение меняется в зависимости от погоды.

Секретное оружие и скромный ИИ

Alien Worlds Кертиса Уайта (при поддержке GPT, Disco Diffusion)

В то время как ИИ генерировал точные изображения, я начал со своего видения, своего намерения и рассматривал все как простое ведение ИИ к моему результату. Однако примерно в это же время я узнал об Open GPT, который был текстовым генератором, и начал использовать его для описания картин, которые я позже передал Disco Diffusion. И это привело к вышеописанному результату и некоторым из самых художественных и интересных работ, которые я, как мне кажется, создал.

«Чужие миры» Кертиса Уайта

Не верьте лжи

Ретро-футуризм Кертиса Уайта (AI Art)

Позвольте мне сделать шаг, чтобы объяснить больше для всех тех традиционных художников, которые сейчас думают, что ИИ сделал всю работу. Мне пришлось взломать GPT, чтобы получить результаты, которые я хотел. Я быстро взломал GPT, чтобы получить желаемое видение, а затем быстро взломал этот результат. Более того, некоторые из этих работ я перенес в Photoshop и выполнил обширную и дополнительную постобработку, чтобы сделать их как можно лучше.

Лучшая часть ИИ для цифрового художника заключается в том, что вместо того, чтобы начинать с белого фона (или градиентной заливки, как рекомендовал Маллинз), вы можете начать с любого уровня, который вы хотите, и работать над решением проблем вашей картины на вашем уровень. Это огромная ценность.

Говоря о фотошопе

Цифровая живопись/Композиция Dalle2 из нескольких тиражей Кертиса Уайта

Мои навыки фотошопа значительно улучшились с моими навыками искусственного интеллекта. Возможность использовать ИИ позволила мне сосредоточиться на технике рисования и решении конкретных задач. Важно отметить, что технология ИИ также быстро развивалась. Ниже приведен пример моего цифрового рисования в Photoshop, в котором я скомпоновал несколько прогонов AI, аля «стиль матового рисования», чтобы получить желаемый конечный результат.

Дедал автора Кертис Уайт

На этом заканчивается первая часть моего путешествия в искусстве ИИ. Я расскажу больше о том, как я раздвинул границы в фотореалистичных работах с искусственным интеллектом, и о факторах, которые привели к моему уходу, во второй части.

Тебе понравилась эта статья? Комментируйте, ставьте лайки и обязательно подписывайтесь . Мне нужно набрать 100 подписчиков на Medium, чтобы получить долю от прибыли.