क्या एआई वीसी की जगह ले सकता है? तीन प्रयोग
वर्तमान में हम इस बारे में बहुत कुछ सुन रहे हैं कि जनरेटिव एआई, विशेष रूप से चैटजीपीटी जैसे बड़े भाषा मॉडल, सफेदपोश ज्ञान श्रमिकों की जगह कैसे ले सकते हैं। और वेंचर कैपिटलिस्ट, कम से कम अपनी नौकरी के एक बड़े हिस्से में, नॉलेज वर्कर होते हैं। तो वीसी की नौकरी के कौन से हिस्से एआई संभाल सकते हैं?
निष्कर्ष के साथ शुरू करने के लिए: एलएलएम की वर्तमान पीढ़ी कुलपतियों (यहां तक कि बहुत जूनियर) को बदलने के लिए पर्याप्त रूप से सक्षम नहीं है। लेकिन इसमें कोई संदेह नहीं है कि एआई उपकरण परिपक्वता के स्तर तक पहुंच गए हैं जो वीसी और इसी तरह के व्यवसायों को उनके दैनिक कार्यों में सार्थक रूप से बढ़ा सकते हैं, विशेष रूप से थकाऊ कार्यों के पहले मसौदे के साथ।
यह पता लगाने के लिए कि अभी क्या संभव है (मई 2023 में), मैंने विशिष्ट वीसी कार्यों को बढ़ाने के तरीके का पता लगाने के लिए तीन प्रयोग किए:
- निवेश मेमो लिखना
- बाजार विश्लेषण का संचालन
- इंट्रो बनाना
जब वीसी एक कंपनी को पसंद करते हैं और निवेश पर गंभीरता से विचार कर रहे हैं, तो वे एक निवेश मेमो लिखते हैं। यह एक बहु-पृष्ठ दस्तावेज़ है जो स्टार्टअप की ताकत और कमजोरियों को रेखांकित करता है और निवेश समिति को सिफारिश करता है। इस तरह का मेमो लिखना एक महत्वपूर्ण विश्लेषणात्मक कार्य है, लेकिन साथ ही थकाऊ भी है क्योंकि सभी प्रासंगिक डेटा बिंदुओं को इकट्ठा करना काफी मैन्युअल काम है।
इस प्रयोग के लिए मैंने जो छोटा पायथन प्रोग्राम लिखा था, वह एक स्टार्टअप के लिए पीडीएफ पिच डेक लेने में सक्षम है - इस बिंदु पर चित्रों और तालिकाओं को छोड़कर सभी आवश्यक विवरणों के साथ स्वचालित रूप से 7–8 पेज का निवेश मेमो उत्पन्न करने के लिए है। GPT-3 पर आधारित पिछले संस्करण ने लगातार बहुत सारी गलतियाँ कीं, लेकिन GPT-4 संस्करण उल्लेखनीय रूप से विश्वसनीय है। यह कभी-कभी वास्तव में जटिल स्लाइडों से भ्रमित हो जाता है, लेकिन यह जटिल संख्यात्मक तालिकाओं से भी अधिकांश विवरण सही प्राप्त करता है। परिणाम निश्चित रूप से सही और पूर्ण नहीं है, लेकिन पहले मसौदे के रूप में काफी अच्छा है।
एक उदाहरण के रूप में, यहाँ हमारे b2venture पोर्टफोलियो कंपनी Edurino से मूल बीज पिच डेक पर आधारित कुछ आउटपुट है । मॉडल बहुत सकारात्मक निष्कर्ष पर पहुंचा। स्पॉइलर: हमने b2venture में निवेश करना समाप्त कर दिया है, इसलिए मॉडल सही है। निम्नलिखित चित्र मॉडल द्वारा बनाए गए असंपादित आउटपुट हैं, गोपनीयता के लिए संपादित किए गए हैं।
अगली तस्वीर उस मॉडल के लिए संकेत है जो विस्तार से बताती है कि एक निवेश मेमो क्या है और प्रत्येक अनुभाग क्या करता है। GPT-4 से उपयोगी परिणाम प्राप्त करने के लिए, इन संकेतों को सावधानीपूर्वक तैयार करना आवश्यक है। यह विशेष रूप से शायद संस्करण 20 या तो है।
चूँकि GPT-4 अभी भी काफी धीमा और महंगा है, इसमें लगभग 5 मिनट लगते हैं और इसकी कीमत $1.50 है। किसी ऐसी चीज़ के लिए बहुत भयानक नहीं है जिसे मैन्युअल रूप से करने में कई घंटे लगेंगे।
बाज़ार विश्लेषण
एक बाजार क्षेत्र और उसमें विभिन्न खिलाड़ियों का विश्लेषण करना सबसे महत्वपूर्ण है, लेकिन उद्यम पूंजी में सबसे अधिक समय लेने वाला कार्य भी है। अधिकांश बाजार आज बहुत गतिशील और शोरगुल वाले हैं, इसलिए आपको अक्सर दर्जनों कंपनियों (स्टार्टअप और मौजूदा दोनों) को यह समझने के लिए देखना पड़ता है कि क्या हो रहा है। इन सभी कंपनियों को खोजने में कई दिन लग सकते हैं।
तो एआई कैसे मदद कर सकता है? स्वायत्त AI (जैसे कि AutoGPT फ्रेमवर्क) में हाल के कुछ विकासों से प्रेरित होकर, मैंने एक प्रोटोटाइप तैयार किया, जो कंपनी के नाम के आधार पर बाजार विश्लेषण के पहले मसौदे के साथ आने में सक्षम है - आमतौर पर वह स्टार्टअप जिसमें आप निवेश करने पर विचार कर रहे हैं। - और क्षेत्र का वर्णन करने वाले कुछ उच्च-स्तरीय कीवर्ड। प्रोटोटाइप तब स्वतंत्र रूप से बाजार विश्लेषण करता है।
नतीजा काफी उल्लेखनीय है। मैं हमारे मौजूदा b2venture पोर्टफोलियो कंपनी Decentriq का उदाहरण यहां एक उदाहरण के रूप में उपयोग कर रहा हूं क्योंकि इसका बाजार बहुत गतिशील है, बाहरी लोगों के लिए समझना आसान नहीं है और इसमें स्टार्टअप और बड़े पदाधिकारियों का मिश्रण शामिल है।
GPT-4-आधारित प्रोटोटाइप स्वचालित रूप से कई दर्जन प्रासंगिक कंपनियों की पहचान कर सकता है, दोनों प्रत्यक्ष और अप्रत्यक्ष प्रतिस्पर्धी। यह परिचय के रूप में संक्षिप्त बाजार सारांश लिख सकता है। और सबसे आश्चर्य की बात यह है कि यह विशिष्ट 2x2 प्रतिस्पर्धी मैट्रिक्स बनाने के लिए प्रासंगिक भेदभाव कारकों और रैंक कंपनियों के अनुसार आ सकता है। इस सब में लगभग आधा घंटा लगता है और एपीआई शुल्क में $2–3 की लागत आती है।
बेशक यह वास्तविक बाजार विश्लेषण के लिए केवल एक शुरुआती बिंदु है। इन परिणामों पर विशेषज्ञों की बहुत सारी टिप्पणियाँ और विभिन्न दृष्टिकोण होंगे।
दो मुख्य अड़चनें: एआई केवल सार्वजनिक सूचनाओं का विश्लेषण कर सकता है, जो सटीक हो भी सकती है और नहीं भी। और जटिल बाजारों में, अक्सर कंपनियों और उप-क्षेत्रों के बीच सूक्ष्म बारीकियों को समझना आसान नहीं होता (माना जाता है कि यह मानव विश्लेषकों के लिए भी एक चुनौती है)।
यह कैसे काम करता है? प्रोटोटाइप विश्लेषण बैकएंड के रूप में GPT-4 का उपयोग करता है, लेकिन कच्चे डेटा को प्राप्त करने और संसाधित करने के लिए बहुत सारे पायथन प्रवंचना भी करता है।
- सिस्टम उद्योग का वर्णन करने वाले उपयोगी वेब पृष्ठों की पहचान करने के लिए कई वेब खोज करता है। GPT-4 प्रत्येक पृष्ठ की प्रासंगिकता की भविष्यवाणी करता है ताकि आगे की प्रक्रिया सबसे उपयोगी सामग्री पर ध्यान केंद्रित कर सके।
- GPT-4 फिर इन पृष्ठों का विश्लेषण करता है और सामग्री से प्रासंगिक कंपनियों की पहचान करता है, साथ ही प्रत्येक कंपनी के विवरण और प्रासंगिकता रैंकिंग के साथ।
- सिस्टम क्रंचबेस डेटा (पेड क्रंचबेस एपीआई से) वाले डेटा वेयरहाउस से प्रत्येक कंपनी के लिए फंडिंग की स्थिति का पता लगाता है।
- सिस्टम तब GPT-4 को बाजार सारांश लिखने और 2x2 मैट्रिक्स के लिए कच्चे डेटा के साथ आने के लिए कहता है।
पृष्ठभूमि में कुछ ही मिनटों में बाजार अनुसंधान सहायक द्वारा बनाई गई - पहले से ही बाजार की मौजूदा स्थितियों की तरह की पहली ठोस समझ के साथ स्टार्टअप्स के साथ शुरुआती कॉल में जाना बहुत अच्छा है। सबसे महत्वपूर्ण पहलू जो वीसी जल्दी समझना चाहते हैं, वह यह है कि कोई स्टार्टअप खुद को कैसे अलग करता है। इस चर्चा के लिए इसके बाजार में कोई अतिरिक्त अंतर्दृष्टि इसलिए बहुत उपयोगी है।
नेटवर्क खनन
वीसी बहुत सारे परिचय देते हैं। बार-बार, पोर्टफोलियो कंपनियां भविष्य के फंडिंग राउंड के लिए संभावित ग्राहकों, सलाहकारों या संभावित निवेशकों से परिचय कराना चाहती हैं। ये इंट्रो बनाना वीसी की मदद करने के सर्वोत्तम तरीकों में से एक है।
यह काफी आसान लगता है, लेकिन वास्तव में यह तुच्छ नहीं है। यदि आप मेरी तरह हैं, तो लिंक्डइन और अन्य जगहों पर आपके हजारों संपर्क हैं, करीबी दोस्तों से लेकर जिन लोगों से मैंने 2005 में एक सम्मेलन में दो मिनट के लिए बात की थी। और निश्चित रूप से लोग नौकरी बदलते रहते हैं, इसलिए यह पता लगाना कि कौन अभी प्रासंगिक स्थिति में होना आसान नहीं है।
अधिकांश पेशेवरों के पास अब एक यथोचित वर्तमान लिंक्डइन प्रोफ़ाइल है, इसलिए यह एक प्रारंभिक बिंदु है। लेकिन दुर्भाग्य से, लिंक्डइन की खोज विशेषताएं काफी निराशाजनक हैं, जो सही व्यक्ति को खोजना अभी भी कठिन बना देता है।
अपने लिंक्डइन संपर्कों को अधिक खोजने योग्य बनाने के लिए, मैंने जनरेटिव एआई और सिमेंटिक खोज का उपयोग किया। मैंने निम्नलिखित किया:
- कई आसानी से उपलब्ध स्क्रेपर्स में से एक के साथ मेरे लिंक्डइन संपर्कों को परिमार्जन करें। यह अभी भी एक कठिन प्रक्रिया है (एपीआई नहीं होने के लिए लिंक्डइन पर शर्म की बात है), लेकिन यह काम करता है।
- संपूर्ण प्रोफ़ाइल के पूर्ण, GPT-4 जनरेट किए गए सारांश के साथ सबसे महत्वपूर्ण प्रोफ़ाइल का विस्तार करें। यह अपेक्षाकृत महंगा और धीमा है, इसलिए मैंने इसे केवल सबसे महत्वपूर्ण प्रोफाइल के लिए किया। बाकी के लिए मैंने सिर्फ जॉब टाइटल, कंपनी और हेडलाइन का इस्तेमाल किया।
- OpenAI के एम्बेडिंग API का उपयोग करके एम्बेडिंग (प्रोफ़ाइल टेक्स्ट का वेक्टर प्रतिनिधित्व) बनाएं ।
- वेक्टर डेटाबेस में प्रोफ़ाइल एम्बेडिंग लिखें। मैंने Pinecone और FAISS की कोशिश की , जिसने तुलनात्मक परिणाम प्रदान किए। यह प्रोफाइल को सिमेंटिक तरीके से तुरंत खोजने योग्य बनाता है, यानी एक पूर्ण कीवर्ड मैच होना जरूरी नहीं है, लेकिन डेटाबेस उन अवधारणाओं की पहचान कर सकता है जो आप जो मांग रहे हैं उसके समान हैं।
- फिर मैंने एक छोटा सा वेब ऐप लिखा (या जीपीटी-4 को लिखने के लिए कहा, जो उसने सेकंड में किया) जो मुझे डेटाबेस खोजने की सुविधा देता है।
यह अब तक सही नहीं है। बहुत बार, यह स्पष्ट नहीं होता है कि खोज इंजन ऐसा परिणाम क्यों प्रदान कर रहा है जिसका मूल क्वेरी से कोई लेना-देना नहीं है। लेकिन पहली बार में सही लोगों को खोजने की तुलना में इस शोर को फ़िल्टर करना बहुत आसान है, इसलिए यह अभी भी बहुत समय बचाने वाला है। और सकारात्मक पक्ष पर, आप ऐसे लोगों के प्रोफाइल देखते रहते हैं जिनके बारे में आपने कभी सोचा भी नहीं होगा, लेकिन वास्तव में अधिक अप्रत्यक्ष और रचनात्मक तरीके से प्रासंगिक हो सकते हैं।
बेशक जनरेटिव एआई आपको उन लोगों के लिए परिचय पाठ लिखने में भी मदद कर सकता है जिनसे आप संपर्क करना चाहते हैं। इसके लिए मैं अपनी पोर्टफोलियो कंपनी TextCorte x के टूल्स का इस्तेमाल करता हूं। उनका अगली पीढ़ी का उत्पाद मेरी शैली की और भी बेहतर नकल कर सकेगा। लेकिन यह आश्चर्यजनक है कि कैसे TextCortex के Zeno सहायक को पहले से ही सही तथ्य मिल जाते हैं जिनका मैंने उल्लेख भी नहीं किया।
कुछ चीजें मैंने सीखी हैं
अब तक हम में से अधिकांश लोग चैटजीपीटी और इसी तरह के उपकरणों के साथ खेल चुके हैं, और आपने लगभग निश्चित रूप से इन जादुई पलों का अनुभव किया है जब मशीन ने कुछ ऐसा किया जिसकी आपको उम्मीद नहीं थी।
लेकिन जो कोई भी लंबे समय से तकनीक में है, वह जानता है: लोगों द्वारा नियमित आधार पर उपयोग किए जाने वाले कूल डेमो से लेकर व्यवसाय में सुई को सही मायने में आगे बढ़ाने के लिए एक लंबा रास्ता तय करना है।
मेरे प्रयोगों से पता चला है कि GPT-4 (वर्तमान में सबसे उन्नत भाषा मॉडल के रूप में) वास्तव में कुछ चीजों में अच्छा है:
- टेक्स्ट को बहुत ही स्मार्ट और अधिकतर सटीक तरीके से सारांशित करना
- असंरचित पाठ से जानकारी निकालना
- डिलिवरेबल्स के पहले ड्राफ्ट के साथ आ रहा है
- पैटर्न ढूँढना
- मतिभ्रम की प्रसिद्ध समस्या - पतली हवा से कुछ बनाने वाला मॉडल - कई स्तरों पर एक समस्या है। यहां तक कि अगर आप GPT-4 को आपके द्वारा प्रदान किए जा रहे तथ्यों पर टिके रहने के लिए कहते हैं, तो भी यह कभी-कभी कुछ और आविष्कार करेगा। और यहां तक कि बहुत स्पष्ट निर्देश - जैसे "उन कंपनियों को नंबर न दें जिन्हें आप इस पाठ से निकाल रहे हैं" - लगभग 5% समय पर ध्यान नहीं दिया जाता है। यह स्पष्ट नहीं है कि इसे कैसे पूरी तरह से नियंत्रित किया जा सकता है।
- वर्तमान मॉडलों में काफी तंग "टोकन सीमा" है जो इनपुट और आउटपुट के आकार को प्रतिबंधित करती है। उदाहरण के लिए, GPT-4 में वर्तमान में 8k टोकन सीमा है, जो इनपुट और आउटपुट दोनों के लिए लगभग 4-5k शब्दों का अनुवाद करती है। यह बहुत बुरा नहीं है, लेकिन इसका मतलब है कि आप इसे बड़े दस्तावेज़ नहीं भर सकते। व्यवहार में, इसका मतलब है कि आपको अक्सर इनपुट को छोटे हिस्सों में विभाजित करना पड़ता है, जो संदर्भ खोने से अपनी समस्याएं पैदा करता है।
- कचरा अंदर, कचरा बाहर: यह भाषा मॉडल के लिए भी सही है। जब आप वेब खोज जैसे बाहरी डेटा स्रोतों का उपयोग करते हैं, तो यह ध्यानपूर्वक नियंत्रित करना महत्वपूर्ण है कि आप इनपुट के रूप में क्या प्रदान कर रहे हैं. सही परिणाम प्राप्त करने के लिए बहुत से मानव-नेतृत्व वाले ट्वीकिंग आवश्यक हैं।
- ऑटोजीपीटी जैसे "एजेंट-आधारित" ढांचे के आसपास हालिया प्रचार यह सुझाव दे सकता है कि एआई मॉडल पहले से ही स्वतंत्र रूप से कार्य कर सकते हैं। मेरे अनुभव में, यह सच्चाई से बहुत दूर है। एक उपयोगी परिणाम उत्पन्न करने के लिए बाजार विश्लेषण जैसे जटिल कार्य को अभी भी सावधानीपूर्वक स्क्रिप्ट किया जाना है। हालाँकि, निश्चित रूप से अधिक स्वायत्त प्रणालियों के लिए एक रास्ता है।