AI Художники – невидимые танцоры
Это – ежемесячная колонка редактора Никиты, где он, словно старик, ругается на облака.
Читается за
ИИ не может создавать искусство. Потому что главное в искусстве – не эстетика.
Давайте на секунду представим, что вы читаете вычурный журнал об искусстве, в нем наверняка был бы такой кусок:
“Искусство всегда было зеркалом, отражающим убеждения, эмоции и суть своего времени. От шедевров древней Греции, где оно было связующим звеном между религиозным почитанием и общественными ценностями, до революционных выражений современных художников, таких как Малевич и Дали, эволюция художественного творчества охватывает тысячелетия, каждая эпоха добавляет новые слои в его глубину и смысл.
Мраморная статуя Афродиты, приписываемая искусным рукам Праксителия, воплощала в себе не только физическую красоту; она олицетворяла божественную сущность любви и общественные ценности, ее окружавшие. Скульптуры не были просто изображениями; они являлись воплощением коллективного сознания, этоса целой цивилизации.
Переходя к более поздним временам, появление современного искусства в конце 19-го и начале 20-го веков разрушило устоявшиеся нормы, породив новую эру художественного выражения. Художники, такие как Винсент ван Гог и Пабло Пикассо, манипулировали своими кистями как продолжением своих душ. «Звездная ночь» Ван Гога – это не только живописный пейзаж; это вихревое свидетельство его внутренних мук, свидетельство хрупкости и красоты человеческой психики. Точно так же «Герника» Пикассо, монохромная сила, превосходит свое визуальное воздействие; это пронзительный комментарий об ужасах войны, горячий возглас против брутальности конфликта, рожденный трагедией Герники во время испанской гражданской войны”.
Возможно ИИ-искусство – зеркало нашего времени. Нам нравится простое, понятное и эстетичное. И это не плохо, мы устали. Все человечество живет в постоянном информационном шуме, где есть войны, смерти и бесконечные страдания. Мы нашли покой в глупых и милых вещах: видео с котиками, думскролинге и эстетике.
При этом мы не говорим: “Посмотрите на видео, где щенок упал – это настоящее искусство”. Но почему-то чрезмерно много людей считает, что тот же DALL-E создает “искусство”. Нет такого понятия как ИИ-художник, и вряд ли когда-нибудь будет.
Техническая часть
Генеративный искусственный интеллект охватывает системы, способные создавать новый контент в различных средах, он охватывает отрасли, такие как развлечения, дизайн и даже журналистика. Информационные агентства используют ИИ для написания отчетов, дизайнеры получают рекомендации по графике от ИИ, хоть качество может варьироваться, это позволяет преодолеть творческий ступор и начать хотя бы с чего-то.
Важно понимать, как именно функционирует генеративный ИИ. В его основе лежит предсказание следующего элемента данных в последовательности, будь то слово в предложении или пиксель на изображении. Процесс начинается со сбора данных — процесса скармливания модели большого объема данных: картин, книг, текстов.
Трансформеры позволяют ИИ фокусироваться на конкретных частях входных данных, подобно тому, как люди улавливают смысл предложений, выделяя значимые слова.
Генеративный AI, использующий нейронные сети и алгоритмы глубокого обучения, расшифровывает закономерности в этих данных для генерации новых результатов.
Известные модели включают генеративно-состязательные сети (GAN), которые используют две нейронные сети — генератор и дискриминатор. Через игровой механизм по типу двух игроков, GAN улучшают возможности друг друга, генерируя реалистичные изображения, видео и речь.
Допустим, мы хотим создавать изображения кошек с помощью генеративно-состязательной сети. Генератор берет случайный входной вектор и использует его для создания нового изображения кошки. Вначале это может выглядеть как случайные пиксели, но по мере обучения он учится создавать реалистичные изображения.
Дискриминатор затем рассматривает как настоящие изображения кошек из набора данных, так и поддельные, сгенерированные, и пытается классифицировать их как настоящие или поддельные. На основе этой классификации он учится лучше различать изображения на следующем этапе. С другой стороны, генератор учится тому, насколько успешно созданные им образцы обманули дискриминатор, и становится лучше в создании более реалистичных картинок. И так до бесконечности.
Модели диффузии, такие как Stable Diffusion или Imagen от Google, работают путем постепенного добавления и удаления шума из данных, восстанавливая исходные структуры. Основная идея работы диффузионных моделей заключается в том, что они уничтожают обучающие данные, добавляя шум на каждой итерации. Затем модель учится удалять шум, применяя процесс денойзинга, постепенно восстанавливая исходные данные.
После обучения модель может применять изученный процесс денойзинга к новым входным данным и создавать новые образцы. Работая с более шумными данными, со временем модель начинает лучше понимать закономерности и структуру данных, устраняя лишний шум.
DALL-E, созданный OpenAI, является примером диффузионных генеративных моделей, создающих детализированные изображения на основе текстовых описаний с помощью процесса диффузии.
Невидимые танцоры
Как ни крути, все эти процессы упираются в то, что напишет человек. Это факт и главный аргумент AI-художников. “Не каждый может написать столь четкий промпт”. Но ведь дело не в том, насколько эмоционально вы что-то описываете, сколько опыта вы в это вкладываете, а в том, насколько четко говорите с компьютером. В случае, если кто-то другой предложит ИИ создать картинку по такому же запросу, скорее всего, он получит что-то очень близкое.
Подобный алгоритм не работает с людьми. Попросите тысячу художников изобразить “устрашающую ночь”, и что вы получите? Для кого-то страх – это дедлайны, для кого-то – пауки или маньяк, а кто-то боится одиночества. ИИ так не умеет. У него есть набор данных, которые подойдут к запросу, и все.
Единственный способ приблизить это к искусству, поменять под себя. Сделать сгенерированное изображение частью своего опыта и своей жизни, предложить рассмотреть страх, как одиночество и темные оттенки синего, например. И доработать до приемлемого результата. Станет ли это искусством? Вряд ли. Немного ближе по статусу, но за созданием все равно стоит компьютер.
Недавно в X завирусилась картинка, где “художник” говорит о том, как круто у него стали получаться картины, созданные с помощью ИИ. Мы могли бы написать статью в 16 раз длиннее этой о том, насколько он не прав. Но в реальности все максимально просто: не художник стал лучше, а модели. Они учатся быстрее людей, им дают больше данных, времени, и они не умеют уставать.
Писатель Волтер Кирн написал потрясающий текст про это, вот выдержка в вольном переводе:
“Из сотен миллионов изображений, с которыми играл DALL-E, убедительно малая часть является искусством или когда-либо рассматривалась как оное, и то, что может сделать их таковымм, она (модель - прим. ред.) определенно не может предугадать. Она знает, что люди считают "милым", но даже в этом она полагается на изменчивость вкусов и неоднозначность языка. Она стремится решить тысячу загадок, не овладевая самой главной тайной, как это делают только смертные существа. (Зачем я здесь, и что произойдет, когда меня не станет?) Вечно отделенный от последствий и смысла, всегда стремящийся, но никогда не постигающий, ИИ одновременно является картиной проклятия и инструментом для производства подобных картин, до тошноты.
ИИ, безусловно, станет более изобретательным и искусным в своем подражании, до того момента, когда полностью скроет свои уловки через экстраполяцию и перестановку. Но эффекты обманут лишь глаза. Внутренний взгляд ума следит из более глубокого места, интуитивного и древнего, и он будет свидетелем истины о том, что искусство искусственного - это лишь отголосок того, что мы называем искусством”.
Лично для меня ИИ-художники – это невидимые танцоры. Да, они что-то делают, они наверняка есть на сцене, но мы никогда их не увидим.
Также мы не видим глубины и искренности в том, что создает компьютер, не видим в этом человека, его боли и поиска языка повествования, а видим лишь красивые декорации на сцене, к которой приложил руку какой-то автор. Но сцена с декорациями пустует, так же, как пустуют изображения, созданные ИИ.
Помните про зеркало? Вам не напоминает это сравнение с искусственностью социальных сетей, где люди стремятся показать красивую картинку без толики искренности и настоящести, где большинство стремится к пресловутому идеалу, создавая нереалистичное представление реальности и того, как она может выглядеть. Возможно, ИИ-искусство, пусть и случайно, но говорит о многих вещах, которые мы видим в реальном мире. Возможно, по иронии, оно и есть зеркало сегодняшнего дня.
Рекомендуется к прочтению
What to read next
Банковские и микрофинансовые секторы Центральной Азии продолжают трансформацию – Казахстан снижает уровень просроченных кредитов, а в Узбекистане растут ...
Это был финансовый эксперимент нашего редактора Катерины длиною в целый год, полный маленьких побед, трагедий, начинаний “с чистого листа”, смирения и ...
Yandex Qazaqstan представил Станцию Мини третьего поколения. У колонки обновленный дизайн, улучшенный звук и ряд новых функций виртуального ассистента.