Obrazy Google (i Pinterest) a generatywna sztuczna inteligencja w badaniach nad projektowaniem wizualnym gier planszowych

May 08 2023

Uwagi dotyczące paska narzędzi Inspiration

Od lat promuję zalety Grafiki Google na moich kursach dotyczących wyszukiwania obrazów, zwłaszcza w poszukiwaniu „inspiracji” do własnego projektu. Generative AI dodało nową metodę badania obrazu opartą na szybkim pisaniu, która znacznie różni się od pisania w wyszukiwarce.

otwarte materiały szkoleniowe

Korzystając z Grafiki Google, musisz przeprowadzić wyszukiwanie w Internecie, co oznacza niestety, że możesz wyszukiwać tylko rzeczy, które już istnieją. Dzięki generatywnej sztucznej inteligencji możesz „wyszukiwać” rzeczy, które nigdy nie istniały, w efekcie prosząc program o wymyślenie obrazów pasujących do tekstu.

Wyszukiwarka grafiki Google

Celem wyszukiwania grafiki Google jest znalezienie i pobranie istniejących obrazów na podstawie określonych słów kluczowych lub kryteriów. Opiera się na indeksie obrazów dostępnych w Internecie. Użytkownicy wprowadzają zapytania tekstowe, a wyszukiwarka zwraca odpowiednie obrazy ze swojej bazy danych. Wynikiem są zazwyczaj prawdziwe zdjęcia lub ilustracje pochodzące z różnych stron internetowych.

Wyszukiwarka grafiki Google zapewnia dostęp do ogromnej kolekcji obrazów stworzonych przez fotografów, artystów i innych twórców treści. Obrazy istnieją już wcześniej i zostały zrobione lub zaprojektowane przez prawdziwych ludzi, choć można się spodziewać, że w przyszłości w wynikach wyszukiwania pojawi się więcej treści generowanych przez sztuczną inteligencję. Wyniki wyszukiwania zazwyczaj reprezentują twórczość innych osób i podlegają ograniczeniom dotyczącym praw autorskich lub licencji.

Użytkownicy mają ograniczoną kontrolę nad konkretnymi szczegółami lub cechami obrazów, które znajdują w wyszukiwarce grafiki Google. Mogą zawęzić wyszukiwane hasła lub zastosować filtry, ale wyniki zależą od dostępnych obrazów w indeksie wyszukiwarki. Interpretacja obrazów jest pozostawiona widzowi, ponieważ wyszukiwarka nie ma kontekstu dotyczącego intencji użytkownika.

Wyszukiwania na Pintereście są pod tym względem podobne do wyszukiwań w Grafice Google, w rzeczywistości często wyniki, które można znaleźć za pośrednictwem Grafiki Google, to zasadniczo tablice na Pintereście innych osób. Pinterest, podobnie jak Google Images, opiera się na już istniejących elementach wizualnych, ale tablice Pinteresta mają tę szczególną zaletę, że wyrażają intencje kuratorskie innych osób, które celowo stworzyły kolekcje obrazów uporządkowane według jakiegoś tematu lub nagłówka.

W związku z tym możesz użyć wyszukiwania tablicowego na Pintereście jako alternatywy lub uzupełnienia wyszukiwania w obrazie Google, ale pamiętaj, że nawet Pinterest wykazuje wyraźne nastawienie w kierunku wężowych ścieżek, tak jak Google Images, podczas wyszukiwania „projektowania gier planszowych”.

wynik wyszukiwania na Pintereście dotyczący „projektowania gier planszowych” pokazujący wiele wężowych ścieżek

Generatywne tworzenie obrazów AI

Natomiast generatywne tworzenie obrazów AI polega na wykorzystaniu algorytmów sztucznej inteligencji do generowania nowych, unikalnych obrazów na podstawie podpowiedzi tekstowych. Zamiast odzyskiwać istniejące obrazy, model AI generuje nowe wizualizacje od zera. Wykorzystuje techniki głębokiego uczenia się, takie jak generatywne sieci przeciwstawne (GAN) lub wariacyjne autoenkodery (VAE), w celu syntezy obrazów pasujących do podanego opisu tekstu.

Generatywne modele sztucznej inteligencji mogą tworzyć całkowicie nowe i oryginalne obrazy w oparciu o podpowiedzi tekstowe. Algorytmy sztucznej inteligencji uczą się na podstawie zbioru danych istniejących obrazów podczas fazy treningu, a następnie generują nowe obrazy, które przypominają te ze zbioru treningowego. Wygenerowane obrazy mogą być unikalne i pomysłowe, ponieważ model sztucznej inteligencji dokonuje ekstrapolacji z wyuczonych wzorców i generuje wizualizacje, których wcześniej nie widział.

Dzięki generatywnemu tworzeniu obrazów AI użytkownicy mogą sprawować większą kontrolę nad efektem wizualnym. Dostarczając konkretne monity tekstowe, użytkownicy mogą kierować modelem AI w celu generowania obrazów zgodnie z ich pożądanymi atrybutami, stylami lub kompozycjami. Tekstowe dane wejściowe mogą zawierać szczegółowe instrukcje, takie jak określanie kolorów obiektów, kształtów, a nawet opis sceny. Użytkownicy mogą wpływać na interpretację procesu tworzenia obrazu.

Poszukuję nowatorskich koncepcji wizualnych gier planszowych

Typową rzeczą, którą można zrobić z kolekcją obrazów znalezionych za pomocą wyszukiwarki grafiki Google, jest utworzenie tablicy nastrojów, podobnie jak tworzy się tablice obrazów na Pintereście. Tablica nastrojów to narzędzie wizualne lub kolaż, które rejestruje i komunikuje ogólny nastrój, styl i estetykę koncepcji lub projektu.

Zwykle składa się z kolekcji obrazów, tekstur, kolorów, typografii i innych elementów wizualnych zebranych na fizycznej tablicy lub w formacie cyfrowym. Moodboardy są wykorzystywane w różnych dziedzinach kreatywnych, takich jak projektowanie, moda, dekoracja wnętrz i marketing, aby przekazywać pomysły, inspirować kreatywność i wyznaczać kierunek wizualny. Służą jako wizualne odniesienie i pomagają interesariuszom i współpracownikom zrozumieć i dostosować się do pożądanego nastroju lub atmosfery projektu.

Poniżej znajduje się na przykład tablica nastrojów stworzona przez użytkownika Reddita w celu dopracowania wyglądu ich gry:

Tablica nastrojów (źródło)

Wyszukiwarka grafiki Google dla „projektowania gier planszowych” zwraca bardzo dziwne wyniki, dziwne, że istnieje pewne oczywiste uprzedzenie w kierunku wężowych ścieżek:

źródło

Wyniki nie są dużo lepsze, jeśli wyszukasz „pomysły na projektowanie gier planszowych”, które pokazują to samo zauroczenie wężowymi ścieżkami:

źródło

Jak widać, uzyskanie przyzwoitego nastroju/tablicy Pinterest za pomocą Grafiki Google może stanowić nie lada wyzwanie, gdy wyniki są tak podobne (i trochę nudne)! Celem kolekcji obrazów do celów inspiracji jest uzyskanie pewnej równowagi między wyjątkowością, podobieństwem i różnorodnością w szerokim zakresie przykładów, które zasilą Twoją kreatywność.

Teraz porównajmy powyższe obrazy z niektórymi generatywnymi wynikami obrazów AI, opartymi na monicie monochromatycznej cyberpunkowej gry planszowej z neonowymi metalowymi elementami i zaczyna się dziać coś bardzo ekscytującego — aby zrozumieć, jak ekscytujące, wpisz ten sam tekst w obrazie Google szukaj i przygotuj się na duże rozczarowanie. Narzędzie do generatywnej sztucznej inteligencji nie zawodzi jednak:

wow, hmm, całkiem fajne

Obrazy Google dały nam mnóstwo odmian wężowych ścieżek, ale tutaj tylko dwa obrazy przedstawiają zupełnie różne koncepcje gier planszowych, co jest o wiele bardziej przydatne do myślenia nieszablonowego i czerpania inspiracji do projektowania wizualnego.

Teraz możesz zapytać: „Hej, skąd taki monit?” ale piękno generatywnej sztucznej inteligencji polega na tym, że prosisz algorytm, aby coś sobie wyobraził, a nie szukał czegoś, co już istnieje, więc możesz podpowiedzieć wszystko, co możesz wymyślić. Dla porównania, wyszukiwanie grafiki Google wydaje się raczej ograniczone, podczas gdy generatywna sztuczna inteligencja wydaje się całkiem nieskończona pod względem możliwości.

Jeśli chcesz, aby twoja gra zawierała rzeczywiste odniesienia historyczne, aby gracze przypominali sobie kanoniczne klasyki z głębokim kulturowym, nostalgicznym oddźwiękiem, oba narzędzia będą miały swoje zastosowania, ale może się okazać, że poproszenie generatywnej sztucznej inteligencji o wyobrażenie sobie rzeczy, które już istnieją, jej wyniki mogą być nudnym. Oto na przykład porównanie wyszukiwania grafiki Google i generatywnego monitu AI dotyczącego innowacyjnej gry planszowej z szachownicą w stylu retro.

Wynik wyszukiwania grafiki Google (źródło)

Wynik generatywnej sztucznej inteligencji, próba bycia innowacyjnym w szachach.

W powyższym przykładzie powiedziałbym, że Google Images jest wyraźnym zwycięzcą, ponieważ znalazło coś o wiele bardziej interesującego niż to, co może wymyślić generatywna sztuczna inteligencja. Z drugiej strony, najlepszy obraz, jaki znalazł, to tak naprawdę tradycyjna gra w szachy z bardzo artystycznymi figurami i planszą do gry, podczas gdy generatywna sztuczna inteligencja uczyniła szachy bardziej grą w labirynt, która jest innym rodzajem nowości.

Obrazy Google zwykle zwracają wiele bezużytecznych obrazów, zmuszając cię do polowania na dobre znaleziska, podczas gdy generatywna sztuczna inteligencja ma duże prawdopodobieństwo, że uda się ją przybić za pierwszym razem. Oto porównanie wyników dla oburzająco złożonego, namacalnego elementu gry planszowej dla kreatywnych afordancji i interesującej mechaniki :

Grafika Google (źródło)

Generatywna sztuczna inteligencja!

Spróbujmy czegoś bardzo prostego, bezpośrednio w duchu projektowania graficznego: monochromatycznej planszy do gry . Generatywna sztuczna inteligencja jawi się jako wyraźny zwycięzca, ze swoją zdolnością do wyobrażania sobie radykalnie nowych możliwości, zamiast zwracania znanych rzeczy, które już istnieją!

Wynik wyszukiwania Google (źródło)

Generatywna sztuczna inteligencja!

Na podstawie następnego eksperymentu wydaje się, że Grafika Google może być bardzo zdezorientowana, skupiając się na niewłaściwej części frazy, w tym przypadku rozłączając się na teorii kolorów z szybkim projektem gry planszowej w triadycznej kolorystyce, podczas gdy generatywna sztuczna inteligencja utrzymuje nienaruszone rozumiejąc, że szukasz projektu gry planszowej:

Zawieszony na teorii kolorów w wyszukiwarce grafiki Google (źródło)

Generatywna sztuczna inteligencja, przybija to.

Następne szybkie porównanie: plastikowe elementy gry planszowej

Grafika Google zwraca prawie dokładnie ten sam plastikowy element, tak jak w przypadku wężowych ścieżek powyżej, podczas gdy generatywna sztuczna inteligencja dość łatwo wyobraża sobie szerszy zakres alternatywnych możliwości:

Grafika Google (źródło)

Generatywna sztuczna inteligencja

Na koniec porównajmy obrazy Google i generatywne wyniki sztucznej inteligencji dotyczące projektowania gier planszowych dla upiornego świata gry w lochy :

Grafika Google (źródło)

generatywna sztuczna inteligencja

Ten wynik jest intrygujący, ponieważ sztuczna inteligencja ma tendencję do generowania izometrycznych plansz 3D za pomocą tego monitu (przynajmniej za pomocą narzędzia, którego używam), co dodaje intrygującego immersyjnego wymiaru grom planszowym, które zwykle mają płaską (2D) grafikę.

Grafika Google — którą można traktować jako internetową tablicę nastrojów, która jest wstępnie wyselekcjonowana i wymaga dodatkowej przepustki kuratorskiej od użytkowników — daje dziwnie bardziej wesoły (tj. kolorowy) wynik i zawiera opakowanie gry oraz grafikę marketingową.

Jeśli znajdziesz projekt wygenerowany przez sztuczną inteligencję, którego chcesz od razu użyć, znajdź narzędzie do skalowania oparte na sztucznej inteligencji, aby powiększyć obraz, co wygeneruje brakujące piksele i często zapewni wysokiej jakości grafikę nadającą się do wydrukowania (tj. 300 ppi). Na przykład Photoshop wykorzystuje sztuczną inteligencję do powiększania obrazów nawet o 400% bez artefaktów, co może być przydatnym narzędziem w Twoim arsenale do tworzenia prototypów gier planszowych. Ta sama idea dotyczy oczywiście mniejszych elementów gry, takich jak pionki graczy, karty itp.

Przeciwdziałanie stronniczości algorytmicznej z Daft Punk

Irytującą rzeczą związaną z używaniem generatywnej sztucznej inteligencji jest to, że ma ona tendencję do tworzenia głównie białych facetów, jeśli chcesz włączyć ludzkich graczy do swoich inspiracji do badań projektowych. Może również robić bardzo dziwne rzeczy z twarzami i rękami, nawet jeśli spróbujesz dodać słowa „wielorasowy” lub „wieloetniczny” jako słowa w twoim szybkim pisaniu, jak pokazano poniżej.

Białowłosy gracz

Pomieszana kaukaska ręka

Różnorodność w szybkim pisaniu

Jednym ze sposobów, w jaki czasami rozwiązuję tego rodzaju problemy — dziwne twarze i ręce białych mężczyzn — jest napisanie podpowiedzi, aby Daft Punk był w jakiś sposób zaangażowany, który zakłada im kaski na głowy, a czasem rękawiczki na ręce, żebym nie Czuję, że zawsze wymyślam zdjęcia białych kolesi. Technicznie rzecz biorąc, tworzę „androgyniczne” Daft Punki, ale generalnie nie można dostrzec różnicy między płciami ze względu na to, jak bardzo są dopasowane.

Ten pierwszy obraz poniżej jest szczególnie świetny, ponieważ na stole do gry znajdują się małe figurki Daft Punk:

Daft Punk do algorytmicznego odchylenia i AI zniekształconej ręki/twarzy Rescue

Więc po prostu eksperymentuj

Zarówno Grafika Google, jak i generatywna sztuczna inteligencja mogą być świetnymi zasobami podczas przeprowadzania badań nad projektami wizualnymi w ramach procesu prototypowania gry planszowej, chociaż wyniki grafiki Google coraz częściej wydają się gorsze i staromodne w porównaniu z możliwościami generatywnej sztucznej inteligencji. Jedynym wnioskiem z takiego wykładu jest zachęcenie do jak najbardziej kreatywnego i swobodnego eksperymentowania, do czego poniższe obrazy (oczywiście wszystkie z generatywnej sztucznej inteligencji) mają zainspirować do poszukiwania inspiracji.

Podpowiedzi użyte do stworzenia poniższych obrazów wykorzystują takie terminy, jak afordancje, elementy gry i mechanika gry , co powinno pomóc Ci przejść kilka interesujących ścieżek w badaniach nad projektowaniem wizualnym.

Dalsze czytanie i odkrywanie

https://www.copyrightlaws.com/copyright-tips-legally-using-google-images/

Uwagi dotyczące korzystania z Grafiki Google do badań opartych na obrazach.

https://www.businessinsider.com/guides/tech/google-reverse-image-search

Odwróć wyszukiwanie obrazu.

https://graphicmama.com/blog/what-is-mood-board/

Moodboardy to wizualne narzędzie lub kolaż, który rejestruje i komunikuje ogólny nastrój, styl i estetykę koncepcji lub projektu.

https://www.canva.com/learn/make-a-mood-board/

Moodboardy są wykorzystywane w różnych dziedzinach kreatywnych, takich jak projektowanie, moda, dekoracja wnętrz i marketing, aby przekazywać pomysły, inspirować kreatywność i wyznaczać kierunek wizualny.