स्थिर प्रसार 2.0 के बारे में जानने योग्य 4 बातें

Nov 24 2022
स्थिरता एआई ने अपने गहन शिक्षण, टेक्स्ट-टू-इमेज मॉडल के नवीनतम संस्करण की घोषणा की कुछ घंटे पहले, स्थिरता एआई ने अपने लोकप्रिय गहन शिक्षण, टेक्स्ट-टू-इमेज मॉडल के नवीनतम संस्करण की घोषणा की: "स्थिर प्रसार 2.0"।

स्थिरता एआई ने अपने गहन शिक्षण, टेक्स्ट-टू-इमेज मॉडल के नवीनतम संस्करण की घोषणा की

पिक्साबे से सैंटियागो एस्टेला द्वारा छवि

कुछ घंटे पहले, स्थिरता एआई ने अपने लोकप्रिय डीप लर्निंग, टेक्स्ट-टू-इमेज मॉडल के नवीनतम संस्करण की घोषणा की : " स्थिर प्रसार 2.0 "।

यहां जानने के लिए चार बातें हैं:

  • इस संस्करण में टेक्स्ट-टू-इमेज मॉडल डिफ़ॉल्ट रूप से 512x512 और 768x768 पिक्सेल रिज़ॉल्यूशन वाली छवियां उत्पन्न कर सकते हैं।
  • रिलीज में एक अपस्केलर डिफ्यूजन मॉडल है जो तस्वीर के रिज़ॉल्यूशन को चार से बेहतर बनाता है। स्थिर प्रसार 2.0, जब टेक्स्ट-टू-इमेज मॉडल के साथ जोड़ा जाता है, तो अब 2048x2048 या उससे अधिक के रिज़ॉल्यूशन वाले चित्र बना सकता है।
  • एक नया डेप्थ-गाइडेड स्टेबल डिफ्यूजन मॉडल , डेप्थ2आईएमजी, ब्रांड-नई रचनात्मक एप्लिकेशन संभावनाओं के साथ वी1 इमेज-टू-इमेज क्षमता का विस्तार करता है। Depth2img एक इनपुट चित्र (मौजूदा मॉडल का उपयोग करके) की गहराई का अनुमान लगाता है और फिर पाठ और गहराई डेटा दोनों का उपयोग करके नई छवियां बनाता है।
  • रिलीज में एक नया टेक्स्ट-गाइडेड इनपेंटिंग मॉडल भी शामिल है, जिसे नए स्टेबल डिफ्यूजन 2.0 फाउंडेशन टेक्स्ट-टू-इमेज पर एडजस्ट किया गया है, जो किसी तस्वीर के हिस्सों को बदलना आसान बनाता है ।

यह कहानी सबसे पहले The PhilaVerse (my Substack Newsletter) पर प्रकाशित हुई थी।