„Możesz dożyć i zobaczyć stworzone przez człowieka horrory, których nie pojmujesz”
Część 3 sztuki i sztucznej inteligencji

To będzie trzeci z serii postów, które piszę o sztucznej inteligencji i sztuce. Zostały one tylko lekko zredagowane i wpisane na maszynie strumień myśli, chociaż mam nadzieję, że nie są niechlujne.
W części 1 omówiłem, jak wiele odruchowych pytań, które aplikacje do wizualizacji zadawały w tak zwanym dyskursie publicznym — „czym jest sztuka?”, „co w tym kontekście oznacza autentyczność lub oryginalność?”, „czy to samo kopię dzieła innego niż to dzieło, a jeśli tak, to w jaki sposób?” — są w rzeczywistości przyspieszeniem trwających już od dawna pytań i podziałów między sztukami i artystami w ciągu ostatniego stulecia lub dłużej.
W części 2 podzieliłem się spojrzeniem na mój obecny przepływ pracy, aby dać przykład tego, jak faktycznie zamierzam rozpocząć sztuczną inteligencję z moim procesem, i dodałem dalsze przemyślenia i pytania poruszone w pierwszej.

Mimo mojego entuzjazmu nie postrzegam AI jako panaceum, które zmieni świat tylko na „dobre”. Obecny stan rzeczy może być bardziej zbliżony do sekcji „Uczeń czarnoksiężnika” Fantazji.
Niezależnie od tego, jak rewolucyjne jest to narzędzie, jak te aplikacje do wizualizacji do wielu zastosowań końcowych, są to małe ziemniaki w porównaniu ze sposobami, w jakie sztuczna inteligencja zmieni nasz świat w szerszym zakresie — w broni, w metapoznaniu (asystenci AI), w medycynie i biotechnologii, w deepfake/dezinformacja a wyścigi zbrojeń do wykrywania i tak dalej. Prawdopodobne są wielkie i straszne rzeczy, jak słynnie powiedział Tesla: „Możesz dożyć, by zobaczyć stworzone przez człowieka horrory wykraczające poza twoje zrozumienie”.
Nawet na stosunkowo mniejszej arenie obrazów generatywnych widzę potencjalne chmury burzowe gromadzące się na horyzoncie. Myślę, że ważne jest, aby myśleć zarówno o realistycznych wadach, jak i nadal przyglądać się wszechobecnym nieporozumieniom, które mogą zakłócać tę jasność, co, mam nadzieję, będzie na razie moim ostatnim pisemnym artykułem na ten temat. Jakiekolwiek mogą być te okropności, nadchodzą. Lepiej byłoby się do nich przygotować, zamiast robić sensację z przestępstwa, które do tej pory nie miało ofiar.

Co przez to rozumiem? Obecnie większość publicznie dostępnych aplikacji do wizualizacji to projekty open source, stosunkowo małe prywatne startupy lub projekty deweloperskie prowadzone przez szkieletową załogę. Wszystkie z nich są nadal w „testach przedpremierowych”, czyli beta-. Chociaż prawdą jest, że Stability.ai otrzymał 101 milionów dolarów VC na rozwój swoich aplikacji publicznych, większy projekt Stable Diffusion pozostaje open source.
Midjourney ma się wystarczająco dobrze, aby się rozwijać, ale obecnie zatrudnia 11 pracowników, a deweloperzy planują ustalić sobie pensję i po prostu pozwolić jej działać inaczej, bez oferty publicznej ani sprzedaży. Określili się jako niezależne laboratorium badawcze i zamierzają tak pozostać. Teraz, czy będą się tego trzymać, jeśli ktoś machnie im 1 miliardem dolarów pod nosem, to inna historia, ale w tym momencie oczekiwanie ogromnego ruchu wyprzedaży w dół jest po prostu skakaniem w cienie.
Wszystko to nadal jest prawdopodobnie kieszonkową zmianą w porównaniu z sytuacjami, w których firmy takie jak Nvidia , Google i Adobe rzucają swoje projekty beta-rozwojowe na arenę publiczną. (Chociaż oczywiście wiele z nich ma już oferty publiczne, które wykorzystują coś, co można nazwać „AI”).
Nawiasem mówiąc, Stability.ai i Adobe wyraźnie zauważyły szum wokół „kradzieży stylów artystów” i koncentrują swoje przyszłe wdrożenia na stylach, które nie są powiązane z nazwiskami artystów, chociaż użytkownicy nadal mogą wpływać na te same style — wystarczy użyć innych określenia niż ich nazwy. To będzie dla mnie całkiem zabawne, jeśli to właśnie sprawia, że ludzie się wyluzowują.
W części 1 wskazałem na pewne oczywiste rezultaty, gdy sztuczna inteligencja dojrzewa i jest wdrażana przez korporacje i rządy dysponujące odpowiednimi budżetami — „problem uprzedzeń”. Problem z uprzedzeniami w pewnym sensie dotyczy nas bardziej niż technologii, a za chwilę przejdę do innych sposobów, które są prawdziwe.
„Stronniczość sztucznej inteligencji występuje, ponieważ ludzie wybierają dane, z których korzystają algorytmy, a także decydują, w jaki sposób zostaną zastosowane wyniki tych algorytmów. Bez szeroko zakrojonych testów i różnorodnych zespołów nieświadome uprzedzenia mogą łatwo wejść do modeli uczenia maszynowego. Następnie systemy sztucznej inteligencji automatyzują i utrwalają te tendencyjne modele”, Forbes .
Jednak większość krytyków, które do tej pory widziałem, wydaje się być znacznie bardziej zainteresowana rodzajem masowego napadu na dzieła sztuki, który, jak twierdzą, jest w toku. Mówiąc delikatnie, nie jest dla mnie do końca jasne, kto obecnie dokonuje wyzysku, o którym ciągle słyszę. Kto ponosi materialną szkodę?

Jest w tym pewna ironia, ponieważ problem autorstwa, fałszerstw, podróbek, autentyczności kontra odtwarzalności to przykłady wiecznie żywych debat między artystami i tymi, którzy mają na tyle haniebnej reputacji, by się z nami kojarzyć, a jednak jakoś „tym razem jest inaczej”. Jasne, Jan. Jeśli ktoś rzeczywiście „kradnie” lub „wykorzystuje twórczą pracę wszystkich artystów”, powinno być dość jasne, kim są ci ludzie, i równie jasne, jeśli chodzi o wartość finansową wydobytą z jednej grupy i zabraną przez inny.
Te posty na temat sztuki i sztucznej inteligencji były ekspozycją moich ówczesnych przemyśleń i nie mają być niezmienne, więc zawsze jest możliwe, że przegapiłem materialne skutki tego „napadu na sztukę”, ale nie udało mi się znaleźć niczego namacalnego odnoszącego się do żadnego z tych trzech. Z pewnością nie chodzi o zestawy treningowe, jeśli poświęcisz trochę czasu na przeczytanie tego. Jeśli uczenie się i naśladowanie istniejących stylów jest przestępstwem, to mam dla wszystkich złe wieści na temat tego, co robili pracujący artyści, zanim pojawiła się sztuczna inteligencja. Jeśli uważa się, że każdy powinien tworzyć materiały, nad którymi pracuje, sam, nie mówiąc już o od podstaw, to mam złe wieści o tym, jak działa język. W pewnym sensie cała sfera ludzkiej wyobraźni jest korowodem gotowych rzeczy.
Wydaje się, że wszystko, co obecnie dzieje się w tej sprawie, to wiele zranionych uczuć i pochopnych osądów. Media społecznościowe przekształciły się w maszynę, która próbuje przekształcić oburzenie w zysk, więc nie jest to zaskakujące, ale może również służyć odwróceniu uwagi od rzeczywistych zagrożeń.

Pomyśl o tym, co się stanie, gdy firmy takie jak Disney skupią swoje zasoby własności intelektualnej na wirtualnej pamięci podręcznej wspieranych przez sztuczną inteligencję „postaci aktorów” lub gdy Twoja tożsamość może być własnością na zawsze. (Albo w każdym razie przez 70 lat po śmierci). Być może zrobimy dobrze, jeśli zamiast zaostrzać surowość przepisów dotyczących własności intelektualnej, raczej złagodzimy, jeśli całe ramy nie zostaną ponownie rozpatrzone od podstaw.
Wybacz nam, bo nie wiemy, co czynimy.
Jako artysta, pierwszy sposób, w jaki przewiduję, że ta technologia może utrudnić mi życie, prawdopodobnie zacznie się dość przyziemnie. Zaostrzy to istniejące nieporozumienia dotyczące dobrze prowadzonych debat w świecie sztuki, z późniejszymi skutkami w prawdziwym świecie. Można nawet uznać to za podzbiór „problemu z uprzedzeniami”: aplikacje do wizualizacji mogą wyolbrzymiać i tak już krótkowzroczne publiczne opinie na temat tego, kim jest i co robi artysta („ktoś, kto dobrze rysuje”), a część tej krótkowzroczności może krwawić do tego, czego używamy te raczej otwarte narzędzia, a także publiczne poczucie tego, co robi artysta .
Ludzie będą widzieć szybko i łatwo i będą wyobrażać sobie, że sztuka jest łatwa, ale nie będą w stanie rozpoznać, na czym polega wyprodukowanie gotowego dzieła, które jest naprawdę interesujące, lub że projekt lub ilustracja ma na celu rozwiązanie problemu, a nie „robienie ładnych obrazów”.
Dwa z tych nieporozumień wydają mi się oczywiste, z pewnością pojawi się więcej:
- Obraz sam w sobie jest tylko obrazem. Musi być wykorzystany do zrobienia czegoś, nawet tak prostego, by wywołać określone uczucie lub pytanie. Wymaga to intencji i zrozumienia kontekstu zamierzonego „użytkowania”. (Jednocześnie sztuka może również obracać się wokół oddzielania tej relacji lub umieszczania czegoś, co już istnieje, w innym kontekście).
- Artysta wizualny nie jest w rzeczywistości po prostu „kimś, kto potrafi dobrze rysować”, a jeśli ta wiara będzie się utrzymywać w obecności sztucznej inteligencji, tylko przyspieszy to nieporozumienie. „Dobre rysowanie”, czyli techniczna zdolność do reprezentowania za pomocą medium, samo w sobie jest środkiem do celu. Ta intencja wymaga również wolnej woli i rozeznania.
„Co masz na myśli, mówiąc, że ilustracja zajmie 30 godzin? Koleżanka mojego kuzyna/wujka/brata może po prostu wpisać to w Midjourney i zrobi to w 5 minut za 2 kawałki pizzy!”

Tak czy inaczej, moja reakcja w tym przypadku może być taka, jak zawsze: to zatrudnij swojego kuzyna. Daj mi znać, jak to idzie. (Albo jeszcze lepiej… nie.) Jak powiedział Bowie w filmie na początku tego artykułu, „ nie graj w galerii ”.
Rozwiązaniem, jeśli takie istnieje, jest lepsza edukacja na temat roli sprawstwa, intencji, a może przede wszystkim… procesu. Jest to szczególnie ironiczne, biorąc pod uwagę, jak wielu artystów w XX wieku próbowało usunąć intencję i sprawczość z procesu właśnie po to, by zmylić nasze wyobrażenia o roli autora/artysty jako twórcy.

Jak zbadałem w części 2, wydaje się, że wszyscy chcą znać twój proces, z wyjątkiem tego, że nikt tak naprawdę nie chce słyszeć twojego procesu. Chociaż chętnie podzielę się tym, jak powstał konkretny obraz, nigdy nie pytano mnie, jaki jest mój proces tak często, jak odkąd sztuczna inteligencja stała się jego częścią. Nasuwa mi się podejrzenie, że ludzie tak naprawdę nie chcą znać mojego workflow, tylko szukają okazji do zdyskredytowania wyników ze względu na metodę.
W tym przypadku napotykamy kolejne z wszechobecnych błędnych przekonań: im trudniejszy proces, tym bardziej artystyczna jest sztuka.
Weźmy takiego artystę jak Andy Goldsworthy . Jego prace są w większości wynikiem naturalnych procesów — liści wrzuconych do strumienia, topnienia lodu itp. Często usprawiedliwianym tym, co czyni tę sztukę, jest to, że wymaga ciężkiej pracy. Czasami musi stać na mrozie przez wiele godzin lub w innych nieodpowiednich momentach, aby uzyskać odpowiednią jakość światła do zrobienia zdjęcia i tak dalej.
Weźmy teraz użycie przez Johna Cage'a „kreacji kontrolowanych przez przypadek”, takich jak I Ching w kompozycji , lub przykład, którego użyłem wcześniej, 4'33”. Siedzenie w ciszy w sali koncertowej to niewiele pracy w porównaniu z tym, co robi Andy Goldsworthy.
Czy to oznacza, że Goldsworthy jest „lepszym” artystą, ponieważ jest trudniejszy, a jeśli tak, to czy gdybym malował obraz leżąc na łóżku z gwoździ, czy byłby to lepszy obraz niż gdybym wykonywał go podczas masażu stóp? Utrudnianie sobie życia, ograniczanie naszych opcji itp. może odgrywać rolę w akcie twórczym, jeśli jest stosowany w określonym celu. Robienie tego tylko dla siebie jest ewidentnie idiotyczne.
Istnieje również składnik klasowy celowego zwiększania rzadkości i trudności tworzenia sztuki — czy jest to „dla wszystkich”, czy też dla niewielkiej liczby wyjątkowych osób, które prawdopodobnie są oddane swojemu rzemiosłu, ale także zasadniczo kontrolowane przez strażników, szkoły , rodowody itp., szczególnie jeśli chcesz iść z tym dalej niż hobbystycznie. W końcu każdy plebs może zrobić ładny obrazek, ale ja jestem „prawdziwym artystą”, prawda?
Wyobrażam sobie, że widzisz problem, chociaż nie chcę sugerować, że koniecznie jest jedna poprawna odpowiedź.
Ryzyko, które tu badam, może być podobne do zagrożenia ze strony każdej nowej technologii, z którą możemy się zetknąć jako część społeczeństwa. Oczywiście mogą wystąpić zakłócenia na rynku — chociaż myślę, że wciąż jest o wiele za wcześnie, aby wiedzieć, czy aplikacje do wizualizacji ostatecznie stworzą lub zniszczą więcej miejsc pracy w tym procesie — ale często bardziej zjadliwe są skutki społeczne. Nie oczekuję, że Stable Diffusion wywoła falę rozlewu krwi, tak jak zrobiła to prasa drukarska, ale może dodatkowo uzbroić nasze nieporozumienia w nieoczekiwany sposób.
Inna analogia może być nieco bardziej trafna: wyszukiwarka.
O ile wyszukiwanie w Internecie w rzeczywistości nie zrewolucjonizowało ludzkiej inteligencji – ponieważ posiadanie (pozornie) wszystkiego na wyciągnięcie ręki nie daje żadnej dodatkowej możliwości zadawania lepszych pytań ani wiedzy, o co pytać – możemy zapłacić podobną cenę w przyspieszonych skutkach uczenie maszynowe w sztuce.
Chociaż aplikacje wizualizacyjne same w sobie nie są idealnym analogiem dla wyszukiwarki, ponieważ wyniki są kreacjami generatywnymi opartymi na ogromnych zestawach treningowych, a nie na asortymencie już istniejącego adresu IP, można było (i zdarzały się) gorsze analogie. Przynajmniej od strony użytkownika wydaje się, że jest to portal, w którym prosisz o coś („daj mi zdjęcie ryby w stylu art deco”), a on ci to dostarcza.

W moich poprzednich artykułach opisałem tę technologię jako narzędzie właśnie z tego powodu. Intencjonalność i sprawczość implikują hierarchię, która rozróżnia narzędzie i osobę używającą narzędzia. Może pewnego dnia praca z algorytmami uczenia maszynowego będzie bardziej przypominać prawdziwą współpracę, w której naprawdę będziemy musieli przemyśleć tę relację, ale to nie jest ten dzień.
Nikt nie pyta, czy wyszukiwarka Google jest artystą, chociaż może się komuś przydać. W obecnym stanie rzeczy pytanie, czy Midjourney jest artystą, jest równie niespójne, chociaż ostatnio widziałem, jak to się robi prawie wszędzie. Nawet jeśli czasami wykazuje coś, co może przypominać zabawę, nie ma intencjonalności ani sprawczości. Co najwyżej jest to bardziej naturalny proces, taki jak krystalizacja.
Z jednej strony Google jako korporacja nie jest podmiotem neutralnym ani życzliwym. Jego głównym celem jest zysk i jako taki nie jest dobrym zarządcą informacji publicznej. A jednak oto jesteśmy.
Z drugiej strony społeczne skutki wyszukiwania Google mają dużo więcej wspólnego z jego potencjałem do wzmacniania naszych uprzedzeń i uprzedzeń, zamykając nas w nieco bardziej subtelnej „bańce filtrującej” niż media społecznościowe z własnym zastosowaniem „algorytmu”. Wiele z tego efektu nie jest wynikiem algorytmów, ale raczej pytań, które sami do niego zadajemy i sposobów, w jakie je zadajemy.
Otrzymałeś dostęp do wszystkich informacji na świecie.* Czy czujesz się lepiej poinformowany? Czy ten dostęp zmienił Twoje pytania? (Jeśli tak się nie stało, jest to równie niezwykłe, jak gdyby miało, choć może z innych powodów.)
Tak więc, jeśli ta analogia ma jakiekolwiek znaczenie, ma się rozumieć, że rzeczywiste zagrożenia stwarzane przez te aplikacje będą w podobny sposób przejawiać się w sposobach, w jakie większe korporacje mogą wykorzystywać je w celu osiągnięcia zysku, oraz w sposobach, w jakie społeczeństwo nie jest przygotowany na poziom zaangażowania w estetykę, który wydaje się wymagany, aby zrozumieć, że artysta nie jest w rzeczywistości urządzeniem, które dostarcza zdjęcie ryby, gdy nas o to poprosisz.

A więc kończymy na tej samej zagadce, od której rozpoczął się mój pierwszy artykuł na temat sztuki i sztucznej inteligencji.
„Czym jest sztuka?” jest niekończącym się refrenem. To jak irytujący, pozornie samowystarczalny koan Zen. Gdy tylko poważnie się nad tym zastanowisz, odkryjesz, że nie da się tego zmieścić w żadnym pudełku, bez natychmiastowego znalezienia kontrprzykładu, który podzieli pudełko na dwie części.
Stał się bardziej frazesem kończącym myślenie niż pytaniem. Możesz powiedzieć, że określony styl lub podejście jest bez znaczenia i znaleźć niezliczone konkretne przykłady ludzi, którzy znaleźli w nim najgłębszy sens. Można powiedzieć, że to piękno i wzniosłość, tak jak Kant, choć bez uniwersalizującego wsparcia jego transcendentalnego rozumu, który jest po prostu przestawianiem leżaków na Titanicu.
Sztuka to pisuar zawieszony w galerii. To obraz, którego absolutnie nie możesz znieść, cisza w sali muzycznej, punkrockowy show w alejce. Jest większy niż ktokolwiek z nas, a także zdarza się tylko w jednym umyśle. To uroboros. To nie jest tylko jedno medium, ani ograniczone do jednego zmysłu. To krótka historia, którą złapałeś w odpowiednim momencie, aby zmienić swoje życie. To powieść, którą zacząłeś, a której nigdy nie możesz skończyć.
Czy możemy to ocenić na podstawie sławy, umiejętności technicznych lub szacunkowej wartości finansowej? Niektórzy z najbardziej znanych artystów, którzy kiedykolwiek żyli, sprzedawali obrazy za miliony, które wydają się nie bardziej skomplikowane niż rysunek dziecka, a są nieznani artyści, którzy spędzili dziesięciolecia na rozwijaniu umiejętności kreślarskich, które mogą dać szansę aparatowi wysokiej jakości. I wzajemnie. W obu przypadkach warto pamiętać, że pozory mogą mylić, a sztuka często bywa myląca.
Mimo wszystko „Czym jest sztuka?” wydaje się banalnym pytaniem. Jakby to musiało mieć prostą, pojedynczą odpowiedź, a gdybyśmy mogli to po prostu ustalić, wszyscy moglibyśmy przestać malować, iść do domu i dobrze się wyspać.
Nie ma końca, nie ma odpowiedzi. Istnieje wiele powodów, dla których artysta wizualny może chcieć rozwijać swoje umiejętności kreślarskie lub pracę liniową, a basista może chcieć ćwiczyć skale i frazowanie. Mam nadzieję, że nadal będziemy szanować wartość wkładania tego rodzaju pracy rzemieślniczej, bez nadmiernego jej waloryzowania, a co gorsza, nie tracąc z oczu powodu, dla którego moglibyśmy w ogóle chcieć włożyć ten wysiłek. To nigdy nie było celem samym w sobie. Nie zrobiłam sobie odcisków dlatego, że je lubię, albo dlatego, że chciałam udowodnić, że jestem „prawdziwą artystką”. Zrobiłem to, ponieważ chciałem grać na basie.
Musimy aktywnie przeciwstawić się tak boleśnie redukującemu poglądowi na sztukę i życie.
Kiedy Second Life po raz pierwszy zaoferowało możliwość stworzenia otwartego wirtualnego świata, który mógłby być zupełnie inny niż nasz, niektórzy skorzystali z możliwości wystawiania wirtualnych występów i pokazów w galeriach, które wykorzystywały to, do czego można wykorzystać wirtualną „przestrzeń”. Technologia była prymitywna, ale chwaliłem te próby przekraczania kreatywnych granic, niezależnie od tego, czy się powiodły. Jeszcze bardziej, w miarę rozwoju, SL zaczął przypominać kasyno, centrum handlowe ze striptizem, klub ze striptizem. Oczywiście był to tylko stosunkowo mały projekt, akwarium, ale pokazuje pewien problem z tym, co ludzie zwykle wybierają, gdy otrzymują wolną licencję na „wyobrażanie sobie dosłownie wszystkiego”.
Kiedy patrzymy na transformację „społecznościowego” internetu z miejsca spotkań programistów, artystów z marginesu i dziwaków w globalny rynek, możemy dostrzec przebłysk prawdziwego ryzyka związanego z aplikacjami do wizualizacji.

Nie zrozum mnie źle. Nie czepiam się ludzi, którzy chcą wykorzystać sztuczną inteligencję do wizualizacji kota jedzącego kawałek salami jako ucztę, ani nie mówię, że każda wizualizacja musi przekraczać granice kreatywności. Bez wstydu możemy sprawić, by nasz Batman jadł swoją miskę spaghetti i Harley Quinn przebrany za Alicję w Krainie Czarów w stylu Leonarda Davinciego. W wyobraźni wizualnej jest prosta radość, a jeśli te narzędzia obniżają podstawowe bariery wejścia, to z pewnością nie jest tak źle.
Ale zastanawiam się też, co sobie wyobrazimy, gdy znikną ograniczenia. Sztuczna inteligencja znacznie ułatwi wizualizację, a „dobra sztuka” będzie nie mniej tajemnicza. Nie podpowie nam, po jakie pytania sięgnąć. Nie powie nam, co ma znaczenie ani dlaczego w ogóle pytamy.
Czym jest sztuka? Jaką masz wyobraźnię i wizję, aby zrobić to w następnej kolejności? A potem i potem… Lepiej w ogóle nie zadawać tego pytania, ponieważ jesteś zbyt zajęty malowaniem, podpowiadaniem lub poprawianiem kolorów.
Zaczyna się od prostego impulsu do tworzenia oraz potrzeby powtarzania i ulepszania tych wyników. Następnie proces nabywania modzeli i pytania „poprawić się w kierunku czego?” zaczyna się. Niezależnie od medium, niezależnie od metody. Nasze odpowiedzi stworzą przyszłość, pracując z tą technologią lub bez niej.
Moją największą obawą związaną ze sztuką sztucznej inteligencji może być to, że pokazuje nam, jak płytkie i zamknięte mogą być te odpowiedzi. Jeśli tak, wina pozostanie ludzka, aż nazbyt ludzka. To samo można powiedzieć o zagrożeniach, jakie stwarza.
Mogę mieć tylko nadzieję, że się mylę.

*W rzeczywistości nie otrzymaliśmy pełnego dostępu do światowych informacji poprzez wyszukiwarkę Google i ten mit jest częścią problemu. Ale to puszka robaków na inny dzień.