Tôi đã vượt qua ranh giới của chủ nghĩa hiện thực ảnh AI như thế nào & Tại sao tôi từ bỏ: Phần 1

Nov 28 2022
Mỗi câu chuyện đều bắt đầu từ hơn 3 đến 5 tháng, tôi đã vượt qua các ranh giới trong các kỹ thuật và phong cách “ảnh chân thực” của nghệ thuật AI. Tôi nên chia sẻ trước rằng tôi không phải là nghệ sĩ.
Photorealistic AI hoạt động bởi Curtis White

Mỗi câu chuyện đều có sự khởi đầu của nó

Trong vòng 3 đến 5 tháng, tôi đã vượt qua các ranh giới trong các kỹ thuật và phong cách “ảnh chân thực” của nghệ thuật AI. Tôi nên chia sẻ trước rằng tôi không phải là nghệ sĩ. Tôi là một kỹ sư phần mềm, có lẽ là một nhà công nghệ không có động lực và đã nghiên cứu thị trường một cách sâu rộng. Tuy nhiên, tôi đã thực hành các phương pháp nghệ thuật truyền thống và vẽ kỹ thuật số trong khoảng thời gian 3 năm hơn 20 năm trước! Tôi thậm chí đã học được một mô hình 3d nhỏ.

Lần đầu tiên tôi tiếp xúc với nghệ thuật rất có thể là nghệ thuật pixel và nghệ thuật kỹ thuật số thời kỳ đầu của máy tính. Tại một thời điểm nào đó, tôi biết được rằng hầu hết các tác phẩm nghệ thuật điểm ảnh tuyệt vời mà tôi đánh giá cao đều là bản sao của các nghệ sĩ vĩ đại khác như Boris Vallejo, Sorayama Hajime hoặc Julie Bell. Nghệ thuật pixel là một kỹ năng rất cụ thể và đôi khi đòi hỏi sự tỉ mỉ mà tôi đánh giá cao nhưng không có hứng thú để thành thạo. Tuy nhiên, điều này dẫn đến việc tôi nghiên cứu các nghệ sĩ bậc thầy mà họ đã sao chép từ đó.

Tôi thậm chí còn có một số ký ức mơ hồ về việc trò chuyện chung với những người vĩ đại về nghệ thuật kỹ thuật số như Craig Mullins. Tôi nhớ cách anh ấy cầu xin loại bỏ nền trắng trống bằng một dải màu và tạo khối trên đó. Đó là một kỹ thuật tuyệt vời cho một người có tay nghề cao như Mullins và cần sự tự do khỏi những kỹ thuật truyền thống ngột ngạt. Nhưng đối với một người không có sự nhạy bén về kỹ thuật như tôi, tôi không chắc đó là cách tiếp cận đúng đắn.

Và, thực sự, điều đó tóm tắt rất nhiều nỗ lực ban đầu của tôi. Đó là sự kết hợp của nhiều giáo lý cổ điển khác nhau và những thứ mà tôi đã cố gắng thu thập từ các chuyên gia khác. Vấn đề thực sự là tôi không có tài năng để đạt được tầm nhìn của mình. Tôi đã mắc một sai lầm khác khi bắt đầu cố gắng tạo ra các tác phẩm gốc quá sớm. Tôi cảm thấy nếu tôi có thể hình dung ra một tác phẩm thì chắc chắn tôi có thể tạo ra nó. Tôi thực sự cảm thấy khả năng nhìn hoặc hướng tới một mục tiêu trong nghệ thuật này là có giá trị - nếu không thì bạn chỉ còn cách sao chép người khác. Tuy nhiên, để đạt được tiến bộ có cấu trúc, người ta phải có một quy trình gần như khoa học về cách người ta sẽ đạt được kết quả mong muốn. Đối với bất kỳ tác phẩm nghệ thuật mới nào, người ta nên biết cách đạt được 80% kết quả cuối cùng — chỉ 20% là học hoặc chưa biết. Đó là cách tôi cảm thấy tiến bộ được thực hiện.

Vì vậy, đến một lúc nào đó, tôi nhận ra rằng mình không thể đạt được tầm nhìn của mình. Và thành thật mà nói, tôi nhận ra điều gì đó về những nghệ sĩ giỏi hơn: họ hài lòng với việc vẽ tranh và khoanh vùng trong thời gian dài trong khi tâm trí tôi bắt đầu quay cuồng khi tôi vẽ. Tôi trở nên buồn chán hoặc bồn chồn khi vẽ tranh. Tôi cần được kích thích trí tuệ nhiều hơn và tập trung lại vào thị trường, giao dịch và công nghệ phần mềm của mình.

Tuy nhiên, “lỗi” để tạo ra những tác phẩm tuyệt vời vẫn còn ẩn sau đó.

Hawker của tương lai

Bit "lỗi" khi tôi biết về Dalle-2. Tôi đã nói với mọi người rằng tôi biết AI và ML sẽ thay đổi nghệ thuật, giao dịch và thế giới như chúng ta biết như thế nào. Nhưng, tôi thực sự không bận tâm đến việc cố gắng tạo ra bất kỳ tác phẩm nghệ thuật nào với các công nghệ AI mới nhất. Và tại một số thời điểm, sự lệch lạc kỳ lạ về kiến ​​thức của công nghệ tương lai và sự thiếu kinh nghiệm của tôi đã gây ấn tượng với tôi: Tôi cần phải có một số kinh nghiệm với công nghệ này.

Khi tôi cố truy cập vào Dalle-2, tôi được biết rằng nó chỉ dành cho một số nhóm người được chọn trước. Tôi không thể truy cập: tuy nhiên, tôi đã biết về một trình tạo AI có tên là “Dalle-mini” mà tôi cũng có thể truy cập.

Dalle-mini

Portals Series Dalle-mini của Curtis White

Dalle-mini tốt nhất có khả năng bằng khoảng 1/1.000 như Dalle2. Hầu hết những người đang sử dụng Dalle-mini đều sử dụng nó để tạo các meme đùa như hình ảnh máy ảnh đường mòn. Nó khá tệ so với Dalle2.

Lúc đầu, tôi đang sử dụng một dịch vụ công cộng nhưng nhanh chóng nhận ra rằng tôi cần thiết lập máy chủ của riêng mình để có thể tạo đủ lượt chạy. Tôi yêu cầu tôi phải thiết lập máy chủ Linux bên trong dịch vụ Docker hoặc WSDL. Điều này không dành cho người yếu tim và là một thử thách đối với tôi ngay cả khi tôi có nền tảng kỹ thuật vững chắc.

Dalle-mini có một số lợi ích mặc dù nó khá nhanh, chỉ mất khoảng 2 phút để trả về kết quả và quan trọng nhất là miễn phí. Điều này dẫn đến trải nghiệm nghiêm túc đầu tiên của tôi với việc hack nhanh chóng. Với nghệ thuật AI, bạn cung cấp cho AI một mô tả bằng văn bản về tác phẩm nghệ thuật mà bạn muốn thực hiện và nó sẽ đưa ra kết quả. Hầu hết thời gian nó phun ra như chó nôn nhưng nếu bạn tiếp tục hack, tiếp tục nhắc nhở, bạn có thể bắt đầu thu được một số kết quả tốt. Để có được một kết quả tuyệt vời là tất cả về kỹ năng gợi ý nghiêm túc và sau đó để nó tạo ra rất nhiều hình ảnh để chọn ra những tác phẩm tốt nhất.

Bạn có thể thấy “công việc cổng thông tin” ban đầu của tôi được giới thiệu ở phần đầu của phần này. Dalle-mini tạo ra hình ảnh có độ phân giải tương đối thấp nhưng tôi có thể nhận được kết quả tốt hơn bằng cách sử dụng thuật toán AI lấy mẫu siêu rộng hoặc lấy mẫu.

Cổng thông tin của Curtis White với AI Siêu phân giải
Nghiên cứu về nhân vật của Curtis White (Dalle-mini với AI Super Resolution)

Dalle-mini có thể tạo ra các mô tả bằng hình ảnh nhưng chúng thường không mang tính nghệ thuật cao. Nó thường xuất ra theo nghĩa đen, không tinh tế và thường không nghệ thuật. Tất nhiên, điều đó không có nghĩa là nó không thể tạo ra thứ gì đó nghệ thuật bằng cách hack nhanh chóng nghiêm trọng và chạy máy chủ của riêng tôi nhưng một nghệ sĩ truyền thống sẽ không mất ngủ vì khả năng của nó.

Những tác phẩm ban đầu của Disco Diffusion

Cổng Tannhauser, Lấy cảm hứng từ Blade Runner, bởi Curtis White
Cổng Tannhauser, Lấy cảm hứng từ Blade Runner, bởi Curtis White

Lần đầu tiên tôi nhìn thấy một đoạn Disco Diffusion được gắn thẻ trên twitter, tôi đã rất ngạc nhiên. Mức độ chi tiết thật đáng kinh ngạc! Nó gần như là quá nhiều chi tiết. Không giống như những mô tả có độ phân giải thấp theo nghĩa đen nhàm chán do dalle-mini tạo ra, đây là những chi tiết có độ phân giải cao, đẹp như tranh vẽ và lộng lẫy. Không có dịch vụ công cộng cho Disco Diffusion. Và card đồ họa của tôi không có đủ bộ nhớ. Thay vào đó, tôi phải trả tiền cho dịch vụ nền tảng điện toán đám mây AI từ xa.

Disco Diffusion có nhiều hạn chế. Nó có thể làm tốt các tác phẩm hội họa nhưng lại gặp khó khăn với các hình vẽ, động vật và chủ nghĩa hiện thực. Mỗi hình ảnh mất khoảng 30 phút để hiển thị so với khoảng 30 giây của Dalle2. Quá trình hack nhanh chóng chậm hơn nhưng vẫn rất quan trọng. Mặc dù không bắt buộc, nhiều nghệ sĩ khuếch tán tham khảo các họa sĩ khác.

Sê-ri Black Panther của Curtis White (Lấy cảm hứng từ Gerald Brom)

Giữ lửa

Fallout và nghệ thuật hậu khải huyền của Curtis White

Sáng tạo nghệ thuật với Disco Diffusion là một công việc cực kỳ chăm chỉ. Khi tôi có một máy chủ từ xa hỗ trợ GPU nhanh, tốt, tôi phải duy trì hoạt động của phiên bản vì chúng chỉ dành cho mục đích sử dụng trong thời gian thực. Bạn muốn tạo đủ ảnh với dấu nhắc tốt để có đủ tác phẩm chọn ảnh mong muốn nhưng không quá nhiều gây lãng phí. Nói chung, khoảng 25 đến 50 thế hệ cho mỗi dấu nhắc được mong muốn. Tôi thường có 2 trường hợp. Tất cả điều này có nghĩa là bạn cần chuẩn bị cho những buổi làm việc kéo dài liên miên.

Tại thời điểm này, tôi nghĩ có thể hữu ích nếu giải thích điều gì đó về tác phẩm nghệ thuật có sự hỗ trợ của AI và tại sao tôi lại làm được nhiều việc như vậy trong một khoảng thời gian ngắn như vậy. Được hỗ trợ bởi AI dẫn đến tăng trưởng và năng suất theo cấp số nhân - nó giống như bộ phim Vô hạn. Điều này rất tiếp thêm sinh lực, thậm chí gây nghiện và khiến bạn sẵn sàng làm việc chăm chỉ hơn. Không bị gò bó trong một phong cách cụ thể hay mô-típ hẹp cũng giúp cho dòng chảy sáng tạo luôn tuôn trào đối với một người có đầu óc không ngừng nghỉ như tôi.

Fallout và nghệ thuật hậu khải huyền của Curtis White

Một nghệ sĩ truyền thống cần học cách giải quyết các vấn đề cụ thể đối với loại tranh mà họ muốn làm. Phát triển một phong cách độc đáo là khó khăn. Nghệ sĩ được hỗ trợ bởi AI có thể tiếp nhận các phong cách mới thường xuyên khi tâm trạng thay đổi theo thời tiết.

Vũ khí bí mật & AI khiêm tốn

Alien Worlds của Curtis White (hỗ trợ GPT, Disco Diffusion)

Trong khi AI tạo ra những hình ảnh chính xác, tôi bắt đầu với tầm nhìn, ý định của mình và xem mọi thứ chỉ đơn giản là dẫn dắt AI đến kết quả của tôi. Tuy nhiên, vào khoảng thời gian này, tôi biết đến Open GPT, một trình tạo văn bản và bắt đầu sử dụng nó để mô tả các bức tranh mà sau này tôi sẽ cung cấp cho Disco Diffusion. Và, điều này dẫn đến kết quả ở trên và một số tác phẩm nghệ thuật và thú vị nhất, tôi nghĩ rằng tôi đã tạo ra.

Thế giới ngoài hành tinh của Curtis White

Đừng tin những lời dối trá

Chủ nghĩa vị lai cổ điển của Curtis White (AI Art)

Hãy để tôi giải thích thêm cho tất cả những nghệ sĩ truyền thống hiện đang nghĩ rằng AI đã làm tất cả công việc. Tôi đã phải nhắc hack GPT để có được kết quả như ý muốn. Tôi đã nhanh chóng hack GPT để có được tầm nhìn mong muốn và sau đó tiếp tục nhanh chóng hack kết quả đó. Ngoài một số tác phẩm này, tôi đã đưa chúng vào Photoshop và xử lý hậu kỳ rộng rãi và bổ sung để làm cho chúng tốt nhất có thể.

Phần hay nhất về AI dành cho nghệ sĩ kỹ thuật số là thay vì phải bắt đầu với nền trắng (hoặc tô màu chuyển sắc như Mullins đề xuất) — bạn có thể bắt đầu ở bất kỳ cấp độ nào bạn muốn và giải quyết các vấn đề về bức tranh của mình theo sở thích của bạn. cấp độ. Đây là một giá trị to lớn.

Nói về Photoshop

Digital Painting/Composited Dalle2 từ nhiều lần thực hiện bởi Curtis White

Kỹ năng photoshop của tôi đã tiến bộ đáng kể cùng với kỹ năng AI của tôi. Khả năng sử dụng AI cho phép tôi tập trung vào kỹ thuật vẽ tranh và giải quyết các vấn đề cụ thể. Điều quan trọng là công nghệ AI cũng đang phát triển nhanh chóng. Dưới đây là một ví dụ về bức tranh kỹ thuật số Photoshop của tôi, trong đó tôi đã kết hợp nhiều lần chạy AI, gọi là “kiểu vẽ mờ” để có được kết quả cuối cùng mà tôi muốn.

Daedalus của Curtis White

Điều này kết thúc phần đầu tiên trong hành trình nghệ thuật AI của tôi. Tôi sẽ chia sẻ thêm về cách tôi vượt qua các ranh giới trong hoạt động của AI theo hình ảnh chân thực và các yếu tố dẫn đến việc tôi bỏ cuộc trong phần 2.

Bạn có thích bài viết này không? Bình luận, thích, và chắc chắn theo dõi . Tôi cần có 100 người đăng ký cho Phương tiện để chia sẻ lợi nhuận cho tôi.