4 điều cần biết về Stable Diffusion 2.0

Nov 24 2022
Stability AI vừa công bố phiên bản mới nhất của mô hình học sâu, chuyển văn bản thành hình ảnh Vài giờ trước, Stability AI đã công bố phiên bản mới nhất của mô hình học sâu, chuyển văn bản thành hình ảnh: “Stable Diffusion 2.0”.

Ổn định AI vừa công bố phiên bản mới nhất của mô hình học sâu, chuyển văn bản thành hình ảnh

Hình ảnh được cung cấp bởi Santiago Estela từ Pixabay

Vài giờ trước, Stability AI đã công bố phiên bản mới nhất của mô hình chuyển văn bản thành hình ảnh , học sâu phổ biến của nó : “ Stable Diffusion 2.0 ”.

Dưới đây là bốn điều cần biết:

  • Các mô hình chuyển văn bản thành hình ảnh trong phiên bản này có thể tạo hình ảnh có cả độ phân giải 512x512 và 768x768 pixel theo mặc định.
  • Bản phát hành chứa mô hình Khuếch tán nâng cấp giúp cải thiện độ phân giải hình ảnh lên gấp bốn lần. Stable Diffusion 2.0, khi được kết hợp với các mô hình chuyển văn bản thành hình ảnh, giờ đây có thể tạo ảnh có độ phân giải 2048x2048 hoặc cao hơn.
  • Mô hình khuếch tán ổn định có hướng dẫn theo chiều sâu mới , deep2img, mở rộng khả năng chuyển hình ảnh sang hình ảnh V1 với các khả năng ứng dụng sáng tạo hoàn toàn mới. Depth2img suy ra độ sâu của hình ảnh đầu vào (sử dụng mô hình hiện có) và sau đó tạo hình ảnh mới sử dụng cả dữ liệu văn bản và độ sâu.
  • Bản phát hành cũng bao gồm một mô hình vẽ theo hướng dẫn bằng văn bản mới , được điều chỉnh trên nền tảng Stable Diffusion 2.0 mới chuyển văn bản thành hình ảnh, giúp dễ dàng thay thế các phần của ảnh .

Câu chuyện này được xuất bản lần đầu trên The PhilaVerse (bản tin Substack của tôi).