एआई के भविष्य के लिए यूएक्स युद्ध का मैदान क्यों है

Nov 25 2022
इस क्षेत्र में नए लोगों के लिए, हम क्लाउड कंप्यूटिंग के बाद सबसे बड़े तकनीकी बदलावों में से एक के दौर से गुजर रहे हैं। मैं इस बदलाव पर बहुत अधिक समय नहीं लगाऊंगा क्योंकि कई महान सारांश और बाजार मानचित्र प्रकाशित हो रहे हैं लेकिन यहां एक स्लाइड है जिसे मैंने सारांशित करने के लिए बनाया है कि क्या हो रहा है।

इस क्षेत्र में नए लोगों के लिए, हम क्लाउड कंप्यूटिंग के बाद सबसे बड़े तकनीकी बदलावों में से एक के दौर से गुजर रहे हैं। मैं इस बदलाव पर बहुत अधिक समय नहीं लगाऊंगा क्योंकि कई महान सारांश और बाजार मानचित्र प्रकाशित हो रहे हैं लेकिन यहां एक स्लाइड है जिसे मैंने सारांशित करने के लिए बनाया है कि क्या हो रहा है।

एआई-संचालित अनुप्रयोगों के हाल के कैम्ब्रियन विस्फोट की खोज करते समय एक प्रश्न जो अक्सर सामने आता है, वह है रक्षात्मकता । ऐसा इसलिए है क्योंकि निवेशक और संस्थापक इस बात से बहुत अवगत हैं कि एआई मॉडल को कमोडिटीकृत किया जा रहा है, इसलिए एआई एप्लिकेशन में न्यूरल नेटवर्क का मूल्य तेजी से घट रहा है।

ये मॉडल OpenAI और Stability.ai जैसी कंपनियों द्वारा खुले में जारी किए गए हैं । यदि आपने अभी तक GPT-3 (OpenAI द्वारा होस्ट किया गया मॉडल) के साथ नहीं खेला है, तो मैं दृढ़ता से आपको सलाह देता हूं, ताकि आप ऑफ-द-शेल्फ मॉडल की लगभग जादुई शक्ति की सराहना कर सकें। यह ध्यान देने योग्य है कि भले ही आप अपने स्वयं के मॉडल बनाना चाहते हों, यह अब तेजी से कठिन होता जा रहा है, क्योंकि AI अनुसंधान बैलेंस शीट की ताकत का कार्य बन रहा है।

एनएलपी पिछले एक दशक में बहुत आगे बढ़ गया है - एलएसटीएम नेटवर्क ने आरएनएन के प्रदर्शन में काफी वृद्धि की है, क्योंकि उनकी अनुक्रम के विभिन्न हिस्सों को चुनिंदा रूप से याद रखने या भूलने की क्षमता है। ट्रांसफॉर्मर और "अटेंशन मैकेनिज्म" (स्केलिंग कानूनों के साथ) ने तब जो संभव था उसमें एक कदम-बदलाव पैदा किया क्योंकि ये मॉडल वास्तव में भाषा को समझने लगे थे। अब, प्रसार मॉडल पुनः आकार दे रहे हैं कि कैसे हम सभी रूपों की सामग्री उत्पन्न कर सकते हैं। ऐसा हुआ करता था कि गहरी शिक्षा में सफलताओं का उपयोग प्रतिस्पर्धात्मक लाभ बनाने के लिए किया जाता था, हालांकि, इन पूर्व-प्रशिक्षित मॉडलों को खुले में रखने के लिए एक सांस्कृतिक और तकनीकी बदलाव ( हगिंग फेस का एक बड़ा हिस्सा था) रहा है। डेवलपर्स अब कोड की कुछ पंक्तियों के साथ अत्याधुनिक AI को अपने उत्पादों में एम्बेड कर सकते हैं।

लेकिन आप प्रतिस्पर्धात्मक लाभ कैसे बना सकते हैं जब हर कोई एक ही मॉडल का उपयोग कर रहा हो?

यूएक्स का मालिक बनें

हम इन बड़े मॉडलों के अव्यक्त स्थान के भीतर छिपी शक्तियों को समझने लगे हैं। आप इन मॉडलों को जितना अधिक संदर्भ प्रदान कर सकते हैं, वे उतने ही बेहतर होते जाते हैं और वे उन कार्यों में तेजी से निपुण हो सकते हैं जिनके लिए पहले बड़ी मात्रा में मजबूत इंजीनियरिंग की आवश्यकता होती थी। पूछने के लिए एक प्रश्न है " क्या इन शक्तिशाली मॉडलों का एकमात्र इंटरफ़ेस हमेशा के लिए एक सरल, स्थिर टेक्स्ट बॉक्स होगा? ”।

अधिकांश उपभोक्ता बहुत गैर-एआई-जागरूक हैं इसलिए उन्हें केवल एक मॉडल के सामने रखने से उनकी समस्या को हल करने में बहुत कम मदद मिलेगी। आज एआई उत्पादों में यूएक्स डिजाइन एक बड़ी ( और शायद सबसे बड़ी भी ) समस्या है।

इष्टतम संकेतों के लिए उपयोगकर्ताओं से आवश्यक संदर्भ एकत्र करने में सहायता के लिए व्यापक कार्यप्रवाह पर ध्यान देना चाहिए। आगे खाई बनाने के लिए मॉडलों की फाइन-ट्यूनिंग के लिए फीडबैक डेटा एकत्र करने के लिए सहज ज्ञान युक्त कार्यप्रवाह भी होना चाहिए।

एक जनरेटिव मॉडल के "वाह" क्षण और किसी को भुगतान करने वाला उपयोगकर्ता बनने के बीच एक बड़ा अंतर है - इस अंतर का अधिकांश हिस्सा एक महान यूएक्स से भरा हुआ है। Jasper.ai एक ऐसी कंपनी का एक बेहतरीन उदाहरण है जिसने इस पर अमल किया है और अब यह अफवाह है कि यह $80m ARR तक पहुंच रही है, जिसे पिछले साल ही लॉन्च किया गया था।

उत्तोलन शीघ्र इंजीनियरिंग

एआई के साथ हम कैसे इंटरैक्ट करते हैं, यह देखते हुए अब एक खाली कैनवास है, जिसके कारण सांख्यिकीय मॉडल के बजाय प्रॉम्प्ट इंजीनियरिंग पर ध्यान केंद्रित किया गया है। मोटे तौर पर इसका अर्थ है किसी मॉडल के लिए अपने इनपुट को इंजीनियरिंग करना, आसानी, सटीकता और लागत के लिए अनुकूलित करना । कुछ उदाहरण हैं:

  • ज़ीरो-शॉट — एक प्राकृतिक भाषा संकेत, जैसे कि आप एक छोटे बच्चे (जो अधिकांश विकिपीडिया को पढ़ता है) से कुछ करने के लिए कह रहे हैं, उदाहरण के लिए इनपुट "कार्य विवरण" होगा: {लक्ष्य पाठ}। यह एआई के साथ बातचीत करने का स्पष्ट रूप से सबसे आसान तरीका है।
  • फ्यू-शॉट - अपेक्षित आउटपुट पर कुछ उदाहरण और कुछ संदर्भ जोड़ना (नीचे चित्र देखें)। इसके लिए अधिक "इंजीनियरिंग" की आवश्यकता होती है, लेकिन सटीकता में व्यापक सुधार हो सकता है । हालाँकि, प्रत्येक संकेत में संदर्भ जोड़ने का अर्थ है कि इसकी लागत बहुत अधिक हो सकती है (नीचे इस पर अधिक)।
  • फाइन-ट्यूनिंग - कई (सैकड़ों या हजारों) उदाहरण लेना और पैरामीटर बदलने के लिए पूर्व-प्रशिक्षित मॉडल को फिर से प्रशिक्षित करना ताकि आपको प्रत्येक संकेत में उदाहरण शामिल करने की आवश्यकता न हो। यह प्रक्रिया बहुत महंगी हो सकती है और इसमें लाखों डॉलर खर्च हो सकते हैं लेकिन एक बार यह हो जाने के बाद, यह हो गया।
स्रोत: OpenAI - लैंग्वेज मॉडल फ्यू-शॉट लर्नर्स हैं

यूज-केस पर ध्यान दें

एआई क्लाउड या मोबाइल की तरह एक प्लेटफॉर्म बनता जा रहा है। ऐसी कई कंपनियाँ हैं जो उस प्लेटफ़ॉर्म के निर्माण पर ध्यान केंद्रित कर रही हैं और इसमें कोई संदेह नहीं है कि वे OpenAI के $20bn मूल्यांकन से प्रमाणित मूल्य की एक बड़ी राशि पर कब्जा कर लेंगी। हालाँकि, एक कारण है कि AWS वर्टिकल SaaS समाधानों के निर्माण पर ध्यान केंद्रित नहीं करता है - प्लेटफ़ॉर्म के निर्माण और उस प्लेटफ़ॉर्म पर उपयोग के मामलों के निर्माण पर ध्यान केंद्रित करना बेहद कठिन है, जो कि Apple के औसत दर्जे के ऐप्स द्वारा प्रमाणित है। हमारा मानना ​​है कि विशिष्ट एआई उपयोग-मामलों और अनुप्रयोगों पर ध्यान केंद्रित करने में अनलॉक करने के लिए बहुत अधिक मूल्य है, ठीक उसी तरह जिस तरह मोबाइल द्वारा उबर बिजनेस मॉडल को अनलॉक किया गया था।

हालाँकि, इस व्यावसायिक मामले को एक चुटकी नमक के साथ लिया जाना चाहिए। एआई के कई उपयोग मामले हैं जो पूर्ण उत्पाद के बजाय "फीचर" बकेट के भीतर बैठते हैं। PhotoRoom , जिसके साथ हमने हाल ही में भागीदारी की है, एक बहुत ही व्यावहारिक AI फीचर के निर्माण में स्टेबल डिफ्यूजन का लाभ उठाने वाली पहली कंपनियों में से एक थी और अब इसने विकास को गति दी है। कई बड़े निगम, जैसे कि नोयन और माइक्रोसॉफ्ट , अब अपने उत्पादों को बढ़ाने के लिए ऑफ-द-शेल्फ मॉडल का लाभ उठा रहे हैं, जो इस बात का सबूत है कि अपने खुद के मॉडल बनाने के बजाय यूआई और शीघ्र इंजीनियरिंग की रणनीति जीत रही है।

मुझे यह भी चेतावनी देनी चाहिए कि कुछ परिस्थितियों में यह मॉडल के मालिक होने और एआई को जमीन से ऊपर बनाने के लिए समझ में आता है। एक विशेष रूप से रोमांचक क्षेत्र निर्णय ट्रांसफॉर्मर में है और केवल सामग्री के बजाय कार्यों को उत्पन्न करने के लिए सफल मॉडल आर्किटेक्चर का लाभ उठाना है। Adept.ai ऐसा करने वाली एक शानदार कंपनी है। मैं इसे एक और पोस्ट में और खोजूंगा ...

मॉडल-नॉमिक्स को समझें

OpenAI $0.02 प्रति 1000 टोकन (लगभग 750 शब्द) चार्ज करता है और यह इस गर्मी में $0.06 से नीचे आ गया। कुछ-शॉट सीखने का उपयोग करते समय, 90% तक संकेत "संदर्भ" हो सकता है, जिसका अर्थ है कि शून्य-शॉट की लागत ~ 10x हो सकती है। स्मार्ट व्यवसाय "संदर्भ" बनाम "लक्ष्य पाठ" अनुपात को अनुकूलित करके और "लक्ष्य पाठ" से किसी भी शब्द को हटाने जैसे चतुर काम करके लाभ का निर्माण कर सकते हैं जो आउटपुट को प्रभावित नहीं करते हैं।

यह स्पष्ट है कि तीसरे पक्ष के मॉडल पर निर्मित व्यवसाय संभावित रूप से मूल्य निर्धारण जोखिम में हैं उसी तरह क्लाउड पर निर्मित व्यवसाय क्लाउड प्रदाताओं के मूल्य निर्धारण जोखिम पर हैं। हमारा मानना ​​है कि एआई को वही संतुलन मिलेगा जो क्लाउड के पास है, जिसमें उत्पन्न मूल्य तीसरे पक्ष की कंपनियों जैसे ओपनएआई द्वारा प्रदान की गई चपलता और शक्ति के लिए भुगतान को सही ठहराता है। कई प्रारंभिक चरण के AI व्यवसाय जिनसे हम मिले हैं, वे 70-80% के सकल मार्जिन के साथ काम करने में सक्षम हैं और हमें लगता है कि यह बढ़ेगा क्योंकि वे अपने मूल्य प्रस्ताव को आगे बढ़ाने में सक्षम हैं।

इसके अतिरिक्त, यह ध्यान देने योग्य है कि क्लाउड कंप्यूट का अधिकांश हिस्सा पहले से ही गहन शिक्षण उपयोग-मामलों के लिए है। यह संकेत देता है कि एआई प्लेटफॉर्म के लिए मूल्य निर्धारण की स्थिर स्थिति उसी क्षेत्र में हो सकती है जहां आज क्लाउड कंप्यूट है, जो कि ज्यादातर व्यवसायों के साथ ठीक लगता है।

मॉडल विस्तार के साथ कम्प्यूट पावर के पकड़ने की एक वास्तविक संभावना है ताकि अत्याधुनिक (या कम से कम अत्याधुनिक ) मॉडल को डिवाइस पर चलाया जा सके - इसका मतलब होगा कि एआई की सीमांत लागत शून्य हो जाती है। Stability.ai पहले से ही अपने कुछ मॉडलों को डिवाइस पर चलाने में सक्षम है , जो अंततः कुछ कार्यों के लिए सीमांत लागत को शून्य तक ला सकता है। एआई प्लेटफॉर्म ( कोहेरे , एआई21 आदि...) की संख्या भी बढ़ रही है , जिनमें से कई अपने मॉडल को ओपन-सोर्स करना चुन रहे हैं। यह भी उल्लेखनीय है कि लागत को कम करने के कुछ चतुर तरीके हैं , जैसे कि मॉडल आसवन।

यह उनकी समग्र मूल्य निर्धारण शक्ति को सीमित करता है और उन्हें अपने शोध का मुद्रीकरण करने के लिए एपीआई कॉल के अलावा और अधिक रचनात्मक व्यवसाय मॉडल के साथ आना पड़ सकता है।

निष्कर्ष

यदि बाजार काफी बड़ा है, तो हम मानते हैं कि उनके मूल में ऑफ-द-शेल्फ मॉडल के साथ जमीन से अनुप्रयोगों के निर्माण से स्टार्ट-अप व्यवधान की बड़ी संभावना है। उदाहरण के लिए, गोंग और ओटर दो महान कंपनियाँ हैं जिन्होंने मालिकाना ट्रांसक्रिप्शन मॉडल के शीर्ष पर उत्पाद बनाए हैं।

अब जबकि अत्याधुनिक ट्रांसक्रिप्शन मॉडल खुले में हैं और एआई की लागत शून्य हो रही है, यह एक स्तर का खेल मैदान है। इसने स्टार्ट-अप्स के लिए UX और Prompt Engineering लेयर के मालिक होने के कारण बड़े पैमाने पर उत्पादकता बाजार में मूल्य हासिल करने का एक बड़ा अवसर खोल दिया है। यदि आप एआई का लाभ उठाने वाले संस्थापक हैं, तो हम आपके साथ बात करना पसंद करेंगे - बेझिझक मुझसे [email protected] पर संपर्क करें

AI द्वारा उत्पन्न छवि के बिना AI ब्लॉग पोस्ट क्या है शीर्षक से प्रेरित (DALL.E 2)