Comment j'ai repoussé les limites du réalisme photo IA et pourquoi j'ai arrêté : partie 1

Nov 28 2022
Chaque histoire a son début Pendant 3 à 5 mois, j'ai repoussé les limites des techniques et du style "photo-réalistes" de l'IA. Je dois d'abord dire que je ne suis pas un artiste.
L'IA photoréaliste fonctionne par Curtis White

Chaque histoire a son début

Pendant 3 à 5 mois, j'ai repoussé les limites des techniques et du style "photo-réalistes" de l'IA. Je dois d'abord dire que je ne suis pas un artiste. Je suis un ingénieur logiciel, peut-être un technologue non motivé, et j'ai étudié les marchés de manière approfondie. Cependant, j'ai pratiqué les méthodes traditionnelles de l'art et de la peinture numérique sur une période d'environ 3 ans il y a plus de 20 ans ! J'ai même appris un peu de modélisation 3D.

Ma première exposition à l'art a probablement été le pixel art informatique et l'art numérique. À un moment donné, j'ai appris que la plupart des grandes œuvres de pixel art que j'appréciais étaient des copies d'autres grands artistes comme Boris Vallejo, Sorayama Hajime ou Julie Bell. Le pixel art était une compétence très spécifique et parfois laborieuse que j'appréciais mais que je n'avais pas l'intérêt de maîtriser. Cependant, cela m'a amené à étudier les maîtres artistes sur lesquels ils ont copié.

J'ai même de vagues souvenirs d'avoir discuté avec des grands noms de l'art numérique comme Craig Mullins. Je me souviens comment il a imploré de se débarrasser du fond blanc vide avec un dégradé et de bloquer les formes par-dessus. C'était une excellente technique pour quelqu'un d'aussi habile que Mullins et qui avait besoin de se libérer des techniques traditionnelles étouffantes. Mais pour quelqu'un sans sens technique comme moi, je ne suis pas sûr que ce soit la bonne approche.

Et, vraiment, cela résume beaucoup de mes premières tentatives. C'était un méli-mélo de divers enseignements classiques et de trucs que j'ai essayé de récupérer auprès d'autres professionnels. Le vrai problème était que je n'avais pas le talent pour réaliser ma vision. J'ai fait une autre erreur lorsque j'ai commencé trop tôt à essayer de créer des œuvres originales. Je sentais que si je pouvais imaginer une œuvre, je pourrais sûrement la créer. Je ressens cette capacité à voir ou à travailler vers un objectif dans l'art comme précieux - ou bien vous êtes simplement laissé à copier les autres. Cependant, pour faire des progrès structurés, il faut avoir un processus presque scientifique quant à la façon d'atteindre le résultat souhaité. Pour toute nouvelle œuvre d'art, il faut savoir comment atteindre 80 % du résultat final - seulement 20 % doivent être en apprentissage ou inconnus. C'est comme ça que j'ai l'impression que des progrès sont faits.

Donc, à un moment donné, j'ai réalisé que je ne pouvais pas réaliser mes visions. Et, pour être honnête, j'ai reconnu quelque chose chez les meilleurs artistes : ils se contentaient de peindre et de s'isoler pendant de longues périodes alors que mon esprit commençait à s'emballer quand je peignais. Je me suis ennuyé ou agité en peignant. J'avais besoin d'une stimulation plus intellectuelle et recentré sur les marchés et le trading et mon ingénierie logicielle.

Cependant, le "bug" pour créer des œuvres magistrales était toujours là en arrière-plan.

Colporteur du futur

Le "bug" quand j'ai entendu parler de Dalle-2. Je disais à tout le monde que je savais comment l'IA et le ML allaient changer l'art, le commerce et le monde tel que nous le connaissons. Mais, je n'avais pas vraiment pris la peine d'essayer de faire de l'art avec les dernières technologies d'IA. Et à un moment donné, l'étrange dislocation de la connaissance de la technologie future et mon manque d'expérience m'ont impressionné : j'ai besoin d'acquérir de l'expérience avec cette technologie.

Lorsque j'ai essayé d'accéder à Dalle-2, j'ai appris qu'il n'était disponible que pour sélectionner un groupe de personnes présélectionnées. Je n'ai pas pu y accéder : cependant, j'ai entendu parler d'un générateur d'IA appelé "Dalle-mini" auquel je pouvais également accéder.

Dalle-mini

Portails Série Dalle-mini par Curtis White

Dalle-mini est au mieux environ 1/1 000e aussi capable que Dalle2. La plupart des gens qui utilisaient Dalle-mini l'utilisaient pour créer des mèmes de blague comme des images de caméra de piste. C'était assez horrible comparé à Dalle2.

Au début, j'utilisais un service public, mais j'ai vite réalisé que je devais configurer mon propre serveur pour pouvoir générer suffisamment d'exécutions. Il fallait que je configure un serveur Linux dans un service Docker ou WSDL. Ce n'est pas pour les âmes sensibles et c'était un défi pour moi même avec ma solide formation technique.

Dalle-mini présentait certains avantages, à savoir qu'il était raisonnablement rapide, ne prenant qu'environ 2 minutes pour renvoyer un résultat et, surtout, gratuit. Cela a conduit à ma première expérience sérieuse avec le piratage rapide. Avec AI art, vous donnez à l'IA une description textuelle de l'art que vous voulez créer et elle crache un résultat. La plupart du temps, il crache comme du vomi de chien, mais si vous continuez à pirater, continuez à demander, vous pouvez commencer à obtenir de bons résultats. Obtenir un excellent résultat consistait en de sérieuses compétences d'incitation, puis en le laissant générer une tonne d'images pour sélectionner les meilleures œuvres.

Vous pouvez voir mes premiers "travaux de portails" présentés au début de cette section. Dalle-mini a produit des images à résolution relativement faible, mais j'ai pu obtenir de meilleurs résultats en utilisant des algorithmes d'IA de super mise à l'échelle ou de suréchantillonnage.

Portails par Curtis White avec AI Super Resolution
Étude de personnage par Curtis White (Dalle-mini avec AI Super Resolution)

Dalle-mini pouvait créer des représentations visuelles mais le plus souvent elles n'étaient pas très artistiques. Il produit généralement le littéral, non raffiné et souvent non artistique. Bien sûr, cela ne veut pas dire qu'il ne pourrait pas créer quelque chose d'artistique avec un piratage rapide sérieux et en exécutant mon propre serveur, mais un artiste traditionnel ne perdrait pas le sommeil sur ses capacités.

Disco Diffusion Premières Œuvres

Tannhauser Gate, inspiré de Blade Runner, par Curtis White
Tannhauser Gate, inspiré de Blade Runner, par Curtis White

La première fois que j'ai vu un morceau de Disco Diffusion tagué sur twitter, j'ai été bluffé. Le niveau de détail était incroyable ! C'était presque trop détaillé. Contrairement aux représentations littérales ennuyeuses à basse résolution créées par dalle-mini, il s'agissait de détails haute résolution, picturaux, splendides. Il n'y avait pas de service public pour Disco Diffusion. Et ma carte graphique n'avait pas assez de mémoire. Au lieu de cela, j'ai dû payer pour le service de plate-forme de cloud computing AI à distance.

Disco Diffusion a de nombreuses limites. Il peut bien faire des pièces picturales mais a du mal avec les figures, les animaux et le photoréalisme. Le rendu de chaque image prend environ 30 minutes contre environ 30 secondes pour Dalle2. Le piratage rapide est plus lent mais toujours critique. Bien que cela ne soit pas obligatoire, de nombreux artistes de diffusion font référence à d'autres peintres.

Série Black Panther de Curtis White (inspiré de Gerald Brom)

Garder le feu attisé

Fallout et art post-apocalyptique par Curtis White

Générer de l'art avec Disco Diffusion est un travail acharné. Lorsque j'ai obtenu un bon serveur distant rapide compatible GPU, j'ai dû garder l'instance active car ils n'étaient destinés qu'à une utilisation en temps réel. Vous voulez créer suffisamment d'images avec une bonne invite pour avoir suffisamment de travaux pour sélectionner l'image souhaitée, mais pas trop pour être inutile. Généralement, environ 25 à 50 générations par invite étaient souhaitées. J'avais souvent 2 instances en cours. Tout cela signifie que vous devez être prêt pour de longues séances de travail marathon.

À ce stade, je pense qu'il peut être utile d'expliquer quelque chose sur les œuvres d'art assistées par l'IA et pourquoi j'ai fait tant de travail en si peu de temps. Être assisté par l'IA conduit à une croissance et à une productivité exponentielle - c'est comme le film Limitless. Ceci est très revigorant, voire addictif, et conduit à une volonté de travailler plus dur. Ne pas être limité à un style spécifique ou à un motif étroit maintient également le jus créatif qui coule pour quelqu'un avec un esprit agité comme moi.

Fallout et art post-apocalyptique par Curtis White

Un artiste traditionnel doit apprendre à résoudre des problèmes spécifiques au type de peinture qu'il veut faire. Développer un style unique est difficile. L'artiste assisté par l'IA peut adopter de nouveaux styles aussi souvent que l'ambiance change avec le temps.

Armes secrètes et IA humiliante

Alien Worlds de Curtis White (assisté GPT, Disco Diffusion)

Alors que l'IA générait les images exactes, j'ai commencé par ma vision, mon intention et j'ai tout considéré comme conduisant simplement l'IA à mon résultat. Cependant, à peu près à cette époque, j'ai pris connaissance d'Open GPT qui était un générateur de texte et j'ai commencé à l'utiliser pour décrire des peintures que j'alimenterais plus tard dans Disco Diffusion. Et cela a conduit au résultat ci-dessus et à certaines des œuvres les plus artistiques et les plus intéressantes que je pense avoir créées.

Les mondes extraterrestres de Curtis White

Ne croyez pas les mensonges

Rétro futurisme par Curtis White (AI Art)

Permettez-moi de faire un pas pour expliquer davantage à tous ces artistes traditionnels qui pensent maintenant que l'IA a fait tout le travail. J'ai dû pirater le GPT pour obtenir les résultats que je voulais. J'ai rapidement piraté GPT pour obtenir une vision souhaitée, puis j'ai piraté plus rapidement ce résultat. De plus, sur plusieurs de ces travaux, je les ai pris dans Photoshop et j'ai effectué un post-traitement approfondi et supplémentaire pour les rendre aussi bons que possible.

La meilleure partie de l'IA pour l'artiste numérique est qu'au lieu d'avoir à commencer avec un fond blanc (ou un remplissage dégradé comme Mullins le recommande) - vous pouvez commencer à n'importe quel niveau que vous voulez et travailler sur la résolution des problèmes de votre peinture à votre niveau. C'est une valeur énorme.

En parlant de Photoshop

Peinture numérique/Composited Dalle2 à partir de plusieurs passages par Curtis White

Mes compétences en photoshop progressaient considérablement avec mes compétences en IA. La possibilité d'utiliser l'IA m'a permis de me concentrer sur la technique de peinture et de résoudre des problèmes spécifiques. Il est important de noter que la technologie de l'IA progressait également rapidement. Vous trouverez ci-dessous un exemple de ma peinture numérique Photoshop où j'ai composé plusieurs exécutions d'IA, à la manière d'un "style de peinture mate" pour obtenir le résultat final que je voulais.

Dédale par Curtis White

Ceci conclut la première partie de mon parcours artistique en IA. Je partagerai plus sur la façon dont j'ai repoussé les limites des travaux d'IA photoréalistes et les facteurs qui ont conduit à mon arrêt dans la partie 2.

As-tu aimé cet article? Commentez, aimez et assurez-vous de suivre . J'ai besoin d'obtenir 100 abonnés pour que Medium me lance un os de partage des bénéfices.