Bagaimana Saya Mendobrak Batas Realisme Foto AI & Mengapa Saya Berhenti: Bagian 1


Setiap Cerita Memiliki Awal
Selama 3 hingga 5 bulan, saya mendorong batasan dalam teknik dan gaya "foto-realistis" seni AI. Saya harus berbagi bahwa saya bukan seorang seniman terlebih dahulu. Saya seorang insinyur perangkat lunak, mungkin seorang teknolog yang tidak termotivasi, dan telah mempelajari pasar secara ekstensif. Namun, saya mempraktikkan metode seni tradisional dan lukisan digital selama sekitar 3 tahun lebih dari 20 tahun yang lalu! Saya bahkan belajar sedikit pemodelan 3d.
Eksposur pertama saya terhadap seni kemungkinan besar adalah seni piksel komputer awal dan seni digital. Pada titik tertentu, saya mengetahui bahwa sebagian besar karya seni piksel hebat yang saya hargai adalah salinan dari seniman hebat lainnya seperti Boris Vallejo, Sorayama Hajime, atau Julie Bell. Pixel art adalah keterampilan yang sangat spesifik dan terkadang melelahkan yang saya hargai tetapi tidak tertarik untuk menguasainya. Namun, hal ini membuat saya mempelajari seniman master yang mereka tiru.
Saya bahkan memiliki ingatan yang samar-samar saat mengobrol dengan seniman digital hebat seperti Craig Mullins. Saya ingat bagaimana dia memohon untuk menyingkirkan latar belakang putih kosong dengan gradien dan bentuk blok di atasnya. Itu adalah teknik yang hebat untuk seseorang yang sama terampilnya dengan Mullins dan membutuhkan kebebasan dari teknik tradisional yang menyesakkan. Tetapi untuk seseorang yang tidak memiliki ketajaman teknis seperti saya, saya tidak yakin itu adalah pendekatan yang tepat.
Dan, sungguh, itu merangkum banyak upaya awal saya. Itu adalah gado-gado dari berbagai ajaran klasik dan hal-hal yang saya coba ambil dari profesional lain. Masalah sebenarnya adalah saya tidak memiliki bakat untuk mencapai visi saya. Saya membuat kesalahan lain ketika saya mulai mencoba membuat karya orisinal terlalu cepat. Saya merasa jika saya bisa membayangkan sebuah karya maka pasti saya bisa membuatnya. Saya benar-benar merasakan kemampuan untuk melihat atau bekerja menuju tujuan dalam seni ini berharga - atau Anda hanya akan menyalin orang lain. Namun, untuk membuat kemajuan yang terstruktur, seseorang harus memiliki proses yang hampir ilmiah tentang bagaimana seseorang akan mencapai hasil yang diinginkan. Untuk setiap karya seni baru, seseorang harus tahu bagaimana mencapai 80% dari hasil akhir — hanya 20% yang harus dipelajari atau tidak diketahui. Itulah bagaimana saya merasa kemajuan dibuat.
Jadi, pada titik tertentu, saya menyadari bahwa saya tidak dapat mencapai visi saya. Dan, sejujurnya, saya mengenali sesuatu tentang seniman yang lebih baik: mereka puas dengan lukisan dan zonasi untuk waktu yang lama sedangkan pikiran saya akan mulai berpacu saat saya melukis. Saya menjadi bosan atau gelisah saat melukis. Saya membutuhkan stimulasi yang lebih intelektual dan fokus kembali pada pasar dan perdagangan dan rekayasa perangkat lunak saya.
Namun, “bug” untuk menciptakan karya yang luar biasa masih ada di latar belakang.
Penjaja Masa Depan
Sedikit "bug" ketika saya mengetahui tentang Dalle-2. Saya memberi tahu semua orang bahwa saya tahu bagaimana AI dan ML akan mengubah seni, perdagangan, dan dunia seperti yang kita kenal. Tapi, saya sebenarnya tidak mau repot-repot mencoba membuat karya seni apa pun dengan teknologi AI terbaru. Dan pada titik tertentu dislokasi yang aneh dari pengetahuan tentang teknologi masa depan dan kurangnya pengalaman saya mengesankan saya: Saya perlu mendapatkan pengalaman dengan teknologi ini.
Ketika saya mencoba untuk mendapatkan akses ke Dalle-2, saya mengetahui bahwa itu hanya tersedia untuk sekelompok orang yang dipilih sebelumnya. Saya tidak bisa mendapatkan akses: namun, saya belajar tentang generator AI bernama "Dalle-mini" yang juga bisa saya akses.
Dalle-mini

Dalle-mini memiliki kemampuan terbaik sekitar 1/1.000 seperti Dalle2. Kebanyakan orang yang menggunakan Dalle-mini menggunakannya untuk membuat meme lelucon seperti gambar kamera jejak. Itu cukup mengerikan dibandingkan dengan Dalle2.
Pada awalnya, saya menggunakan layanan publik tetapi segera menyadari bahwa saya perlu menyiapkan server saya sendiri agar dapat menghasilkan proses yang cukup. Saya harus menyiapkan server Linux di dalam layanan Docker atau WSDL. Ini bukan untuk menjadi lemah hati dan merupakan tantangan bagi saya bahkan dengan latar belakang teknis saya yang kuat.
Dalle-mini memiliki beberapa keuntungan meskipun cukup cepat hanya membutuhkan waktu sekitar 2 menit untuk mengembalikan hasil dan yang terpenting gratis. Hal ini menyebabkan pengalaman serius pertama saya dengan peretasan cepat. Dengan seni AI, Anda memberi AI deskripsi teks tentang seni yang ingin Anda buat dan hasilnya akan keluar. Sebagian besar waktu itu keluar seperti muntahan anjing tetapi jika Anda terus meretas, terus meminta, Anda bisa mulai mendapatkan hasil yang baik. Mendapatkan hasil yang bagus adalah tentang keterampilan mendorong yang serius dan kemudian membiarkannya menghasilkan banyak gambar untuk memilih karya terbaik.
Anda dapat melihat "portal berfungsi" awal saya ditampilkan di awal bagian ini. Dalle-mini menghasilkan gambar beresolusi relatif rendah, tetapi saya bisa mendapatkan hasil yang lebih baik dengan menggunakan algoritme AI super scaling atau up-sampling.



Dalle-mini dapat membuat penggambaran visual tetapi paling sering tidak terlalu artistik. Biasanya menampilkan literal, tidak dimurnikan, dan seringkali tidak artistik. Tentu saja, itu bukan untuk mengatakan bahwa itu tidak dapat membuat sesuatu yang artistik dengan peretasan cepat yang serius dan menjalankan server saya sendiri, tetapi seniman tradisional tidak akan kehilangan tidur atas kemampuannya.
Disco Diffusion Pekerjaan Awal



Pertama kali saya melihat karya Disco Diffusion yang diberi tag di twitter, saya terpesona. Tingkat detailnya luar biasa! Itu hampir terlalu banyak detail. Tidak seperti penggambaran literal beresolusi rendah yang membosankan yang dibuat oleh dalle-mini, ini adalah detail beresolusi tinggi, indah, indah. Tidak ada layanan publik untuk Disco Diffusion. Dan kartu grafis saya tidak memiliki cukup memori. Sebaliknya, saya harus membayar untuk layanan platform komputasi awan AI jarak jauh.
Disco Diffusion memiliki banyak keterbatasan. Ia dapat membuat karya yang sangat indah tetapi berjuang dengan figur, hewan, dan fotorealisme. Setiap gambar membutuhkan waktu sekitar 30 menit untuk dirender dibandingkan dengan sekitar 30 detik untuk Dalle2. Peretasan cepat lebih lambat tetapi masih kritis. Meskipun tidak wajib, banyak seniman difusi mereferensikan pelukis lain.


Menjaga agar api tetap menyala

Menghasilkan seni dengan Disco Diffusion adalah kerja keras yang serius. Ketika saya mendapatkan server jarak jauh berkemampuan GPU cepat yang bagus, saya harus tetap mengaktifkan instans karena hanya ditujukan untuk penggunaan waktu nyata. Anda ingin membuat gambar yang cukup dengan prompt yang bagus agar memiliki cukup banyak pekerjaan untuk memilih gambar yang diinginkan tetapi tidak terlalu banyak sehingga sia-sia. Umumnya sekitar 25 hingga 50 generasi per prompt diinginkan. Saya sering memiliki 2 contoh. Semua ini berarti Anda harus siap untuk sesi kerja panjang maraton.
Saat ini, menurut saya mungkin berguna untuk menjelaskan sesuatu tentang karya seni yang dibantu AI dan mengapa saya melakukan begitu banyak pekerjaan dalam waktu sesingkat itu. Dibantu oleh AI mengarah pada pertumbuhan dan produktivitas eksponensial — ini seperti film Limitless. Ini sangat menyegarkan, bahkan membuat ketagihan, dan mengarah pada kemauan untuk bekerja lebih keras. Tidak terkekang pada gaya tertentu atau motif sempit juga membuat jus kreatif mengalir untuk seseorang dengan pikiran gelisah seperti saya.



Seorang seniman tradisional perlu belajar bagaimana menyelesaikan masalah khusus untuk jenis lukisan yang ingin mereka lakukan. Mengembangkan gaya yang unik itu sulit. Artis yang dibantu AI dapat mengambil gaya baru sesering suasana berubah seiring cuaca.
Senjata Rahasia & AI yang Rendah Hati

Sementara AI menghasilkan gambar yang tepat, saya mulai dengan visi saya, niat saya, dan memandang semuanya hanya dengan mengarahkan AI ke hasil saya. Namun, sekitar waktu ini saya menyadari Open GPT yang merupakan penghasil teks dan mulai menggunakannya untuk mendeskripsikan lukisan yang nantinya akan saya berikan ke Disco Diffusion. Dan, ini mengarah pada hasil di atas dan beberapa karya paling artistik dan menarik, menurut saya, saya buat.


Jangan Percaya Kebohongan


Biarkan saya mengambil langkah untuk menjelaskan lebih banyak untuk semua seniman tradisional yang sekarang berpikir bahwa AI melakukan semua pekerjaan. Saya harus meminta meretas GPT untuk mendapatkan hasil seperti yang saya inginkan. Saya segera meretas GPT untuk mendapatkan visi yang diinginkan dan kemudian segera meretas hasil itu. Terlebih lagi pada beberapa karya ini, saya membawanya ke Photoshop dan melakukan pemrosesan pasca ekstensif dan tambahan untuk membuatnya sebaik mungkin.
Bagian terbaik tentang AI untuk seniman digital adalah bahwa alih-alih harus memulai dengan latar belakang putih (atau isian gradien seperti yang disarankan Mullins) — Anda dapat memulai dari tingkat mana pun yang Anda inginkan dan bekerja untuk menyelesaikan masalah lukisan Anda di tingkat. Ini adalah nilai yang luar biasa.
Berbicara tentang Photoshop


Keterampilan photoshop saya meningkat secara signifikan dengan keterampilan AI saya. Kemampuan menggunakan AI memungkinkan saya untuk fokus pada teknik melukis dan memecahkan masalah tertentu. Yang penting, teknologi AI juga berkembang pesat. Di bawah ini adalah contoh lukisan digital Photoshop saya di mana saya menggabungkan beberapa proses AI, ala "gaya lukisan matte" untuk mendapatkan hasil akhir yang saya inginkan.


Ini mengakhiri bagian pertama dari perjalanan seni AI saya. Saya akan berbagi lebih banyak tentang bagaimana saya mendorong batasan dalam karya AI fotorealistik dan faktor-faktor yang menyebabkan saya berhenti di bagian 2.
Apakah Anda menyukai artikel ini? Komen, sukai, dan pastikan untuk mengikuti . Saya perlu mendapatkan 100 pelanggan agar Medium memberi saya tulang bagi hasil.