आइए जानें आर्टिफिशियल इंटेलिजेंस के बारे में

May 08 2023
नवंबर 2022 में चैटजीपीटी के धमाकेदार रिलीज के बाद से एआई, मशीन लर्निंग, चैटजीपीटी और बहुत कुछ के बारे में एक सीरीज, मैं आर्टिफिशियल इंटेलिजेंस (एआई) को लेकर इम्पोस्टर सिंड्रोम और चिंता महसूस कर रहा हूं। यह क्या करता है, बिल्कुल? यह कैसे काम करता है? आगे क्या होगा? संदर्भ के लिए, मैं एक सॉफ्टवेयर इंजीनियर हूं, और मैं 2020 में स्नातक होने के बाद से Microsoft में काम कर रहा हूं।

एआई, मशीन लर्निंग, चैटजीपीटी, और बहुत कुछ के बारे में एक श्रृंखला

मैं एक एआई की शक्ति से अभिभूत था जो इसे आकर्षित कर सकता था, चैटजीपीटी की शक्ति से अकेले रहने दें। लेकिन मैं आगे बढ़ा, मैंने महल का पता लगाया, और अब मैं अपना नक्शा साझा करने के लिए यहां हूं! बिंग इमेज क्रिएटर के साथ बनाया गया।

नवंबर 2022 में चैटजीपीटी के धमाकेदार रिलीज के बाद से, मैं इम्पोस्टर सिंड्रोम और आर्टिफिशियल इंटेलिजेंस (एआई) को लेकर चिंता महसूस कर रहा हूं। यह क्या करता है, बिल्कुल? यह कैसे काम करता है? आगे क्या होगा? संदर्भ के लिए, मैं एक सॉफ्टवेयर इंजीनियर हूं, और मैं 2020 में स्नातक होने के बाद से माइक्रोसॉफ्ट में काम कर रहा हूं। buzzwords, प्रचार और शब्दजाल।

आइए एआई और क्षेत्र में हाल के विकास के बारे में जानें। यह श्रृंखला किसी के लिए भी है, तकनीकी और गैर-तकनीकी लोगों के लिए समान है, जिनके पास एआई के साथ न्यूनतम अनुभव है। हम एक साथ सीखेंगे कि इन सभी चैटबॉट टूल्स के साथ क्या चल रहा है - चैटजीपीटी, नया बिंग, बार्ड, कोपिलॉट, सूची आगे बढ़ती है। क्या वे अति उत्साहित हैं? वे क्या करने में सक्षम हैं? क्या वे पर्याप्त रूप से निजी, सुरक्षित और नैतिक हैं? ये बड़े प्रश्न हैं, और इन सभी का उत्तर एक पोस्ट में नहीं दिया जा सकता है। लेकिन मुझे आशा है कि अब तक पढ़े गए हर लेख में जो शब्दजाल लगता है, उसके बिना मैं इसे तोड़ दूंगा।

इस लेख में , हम AI की परिभाषा, मशीन लर्निंग, OpenAI और हाल ही में AI उत्पाद घोषणाओं को कवर करेंगे।

इस आलेख में मेरे नियोक्ता Microsoft का उल्लेख है। मैंने यह लेख अपने खाली समय में लिखा था और सभी विचार मेरे अपने हैं।

मैं फरवरी की शुरुआत तक एआई में नहीं आया था , जब हमारी टीम एक ऑर्ग-वाइड एफएचएल के लिए उत्साहित थी - एक फिक्स-हैक-लर्न वीक जहां हम मूल रूप से जो कुछ भी हम चाहते हैं वह करने के लिए मिलता है। जिस विषय पर बातचीत हावी थी, वह चैटजीपीटी और संबंधित उपकरणों की क्षमता थी। मैंने उस सप्ताह को आधुनिक कृत्रिम बुद्धिमत्ता की मूल बातें, इसके आस-पास की शर्तों और हाल ही में जारी किए गए उत्पाद को सीखने में बिताया। मेरी टीम ने मॉडलों को डेटा खिलाया और क्या नहीं, लेकिन मैंने अभी विकिपीडिया के लेख पढ़े और चैटजीपीटी से मुझे यह समझाने के लिए कहा कि यह कैसे काम करता है। एक बार जब मेरी टीम के पास अवधारणा का कार्यशील प्रमाण था, तो मैंने उनसे पूछा कि उन्होंने इसे कैसे बनाया और पिच वीडियो बनाने के लिए स्वेच्छा से काम किया। मैं इतना घबरा गया कि मैंने एक दिन की छुट्टी ले ली। लेकिन मैं सीखता रहा।

और फिर "द न्यू बिंग" जारी किया गया, और GPT-4 सामने आया, और Microsoft 365 Copilot की घोषणा की गई, और Google ने अपनी स्वयं की बहुत सारी घोषणाएँ कीं। ये सभी अविश्वसनीय रूप से महत्वपूर्ण विकास हैं, और वे एआई उपकरणों की नई क्षमता को उजागर करते हैं। वे मेरी अक्षमता और अभिभूत होने की भावनाओं को भी बढ़ाते हैं। लेकिन बाहर निकलने का एकमात्र तरीका है, है ना? तो चलते हैं।

एआई कुछ ऐसा करने की क्षमता है जो "स्मार्ट लगता है" : अच्छी तरह से एक खेल खेलें, लिखावट को पहचानें, भाषण को पाठ में परिवर्तित करें, देखने के लिए वीडियो की सिफारिश करें, या सादे अंग्रेजी में लिखे गए प्रश्न के जवाब में एक पैराग्राफ उत्पन्न करें। यह परिभाषा ऐसा लगता है जैसे इसमें बहुत कुछ शामिल है: और यह करता है! 100 साल पहले बुनियादी अंकगणित से लेकर दस्तावेज़ तैयार करने से लेकर शेड्यूलिंग से लेकर अंतर्राष्ट्रीय सरकारों की योजना बनाने तक सब कुछ मैन्युअल रूप से किया जाता था। उपलब्ध उपकरण केवल मौजूदा जानकारी को प्रसारित कर सकते हैं, वे इसे सारांशित नहीं कर सकते हैं या इसके साथ कुछ भी "कर" सकते हैं। एआई उपकरण बोर्ड गेम में अगला कदम, या खोज क्वेरी में अगला शब्द निर्धारित करते हैं, या किसी शब्द की वर्तनी गलत है या नहीं। कोई भी उपकरण जो आपके इनपुट से भिन्न आउटपुट उत्पन्न कर सकता है, सबसे बुनियादी अर्थ में, एक एआई उपकरण है।

आमतौर पर, हम "उच्च-स्तरीय" AI के बारे में सोचते हैं जो "वास्तव में स्मार्ट सामान" करता है: जब हम YouTube, Facebook, TikTok, Amazon और अन्य जगहों पर मौजूद "एल्गोरिदम" का संदर्भ देते हैं जो सामग्री की सिफारिश करता है, तो हम बात कर रहे हैं एआई एल्गोरिदम। बेशक, जो कोई "वास्तव में स्मार्ट" मानता है, वह इस बात पर निर्भर करता है कि आप किससे पूछते हैं और कब पूछते हैं। 50 साल पहले, कंप्यूटर की चेकर्स खेलने की क्षमता आश्चर्यजनक थी, अब यह "सिर्फ एक संगणना" है। यह एआई प्रभाव है , और मैंने एआई की अपनी पहले की व्यापक परिभाषा के साथ इसका मुकाबला करने की कोशिश की। चैटजीपीटी और अन्य नए "चैटबॉट टूल्स" को लगभग सर्वसम्मति से "उच्च-स्तरीय" एआई माना जाता है, लेकिन वास्तव में चैटजीपीटी और एक साधारण कैलकुलेटर के बीच कोई मौलिक अंतर नहीं है। दोनों इनपुट लेते हैं, कुछ गणना करते हैं (ठीक है, चैटजीपीटी बहुत कुछ करता हैगणनाओं की) और इनपुट के आधार पर कुछ नया आउटपुट दें। दोनों एआई हैं। तो क्या उन्हें अलग करता है?

मशीन लर्निंग सबसे चर्चित तरीका है, जिसके बारे में इंजीनियर इन "उच्च-स्तरीय" एआई एल्गोरिदम को बनाते हैं। और, AI की तरह, मशीन लर्निंग एक बहुत व्यापक क्षेत्र है। मशीन लर्निंग एल्गोरिदम (बनाम कुछ अन्य एआई एल्गोरिदम) की परिभाषित विशेषता यह है कि इंजीनियर "सीधे" यह नहीं बताते हैं कि वास्तव में क्या करना है। इसके बजाय, एक मशीन लर्निंग एल्गोरिदम को प्रशिक्षण डेटा (नमूना इनपुट और आउटपुट) दिया जाता है और इनपुट और आउटपुट के बीच के पैटर्न को "सीखने" की उम्मीद की जाती है। उदाहरण के लिए, एल्गोरिथ्म को "यह एक कुत्ता है" नमूना आउटपुट के साथ कुत्तों की 10,000 तस्वीरें दी जा सकती हैं, और फिर नमूना आउटपुट "यह कुत्ता नहीं है" के साथ शाब्दिक रूप से किसी और चीज़ की 10,000 तस्वीरें दी जा सकती हैं। वहां से, कोई एल्गोरिथम को एक नई तस्वीर दे सकता है, और एल्गोरिथम अपनी सीख का उपयोग यह कहने के लिए करेगा कि "यह एक कुत्ता है" या "यह कुत्ता नहीं है।"

मशीन लर्निंग केवल चित्रों को वर्गीकृत करने तक ही सीमित नहीं है, हालांकि: यह वही मूल प्रक्रिया है जो चैटजीपीटी, "एल्गोरिदम" को शक्ति प्रदान करती है जो सोशल मीडिया और शॉपिंग साइटों, शतरंज एल्गोरिदम, और बहुत कुछ पर मौजूद है। (एक अभ्यास के रूप में, विचार करें कि इन एल्गोरिदम के लिए प्रशिक्षण डेटा क्या हो सकता है।)

आइए एक उदाहरण का उपयोग करें : checkers. एक पारंपरिक एल्गोरिथम में, इंजीनियर कह सकते हैं "ठीक है कंप्यूटर, यहाँ वर्तमान बोर्ड है। सभी संभावित अगली चालों के माध्यम से दौड़ें, और प्रत्येक चाल को दूसरे खिलाड़ी के पास कितने टुकड़े हैं और आपके कितने टुकड़े कमजोर हैं, के अनुसार स्कोर करें। उच्चतम स्कोर के साथ चाल चुनें। इस स्कोरिंग सिस्टम को एक मॉडल माना जाता है: एक गणित फ़ंक्शन जो किसी दिए गए इनपुट के लिए स्कोर की गणना करता है। यह एल्गोरिदम एआई है, लेकिन यह मशीन लर्निंग नहीं है। मशीन लर्निंग में, एल्गोरिदम को प्रशिक्षण डेटा दिया जाएगा: "ठीक है कंप्यूटर, यहां एक चेकर बोर्ड है, यहां सबसे अच्छा अगला कदम है। हम आपको ऐसे 100 उदाहरण दे चुके हैं। चेकर्स खेलना सीखें।" एल्गोरिथ्म अपने स्कोरिंग फ़ंक्शन को फिर से समायोजित करके अपना मॉडल बनाता है क्योंकि यह प्रशिक्षण डेटा के माध्यम से जाता है। यह अनुमान लगाने और अपेक्षित आउटपुट के आधार पर अपना स्कोरिंग बदलता है। जबकि एल्गोरिदम प्रशिक्षण डेटा के माध्यम से जा रहा है, इसे अपने मॉडल को सीखना या प्रशिक्षण देना कहा जाता है। यह तब इस प्रशिक्षित मॉडल का उपयोग नए इनपुट पर भविष्यवाणियां करने के लिए करता है। हम एक प्रशिक्षित एल्गोरिथ्म को एक ऐसा बोर्ड दिखा सकते हैं जिसे उसने पहले कभी नहीं देखा है, और यह अपने मॉडल का उपयोग संभावित अगली चालों को स्कोर करने और अपनी पसंद बनाने के लिए करेगा।

OpenAI ChatGPT के पीछे की प्रयोगशाला है । यह 2015 में स्थापित किया गया था। OpenAI ने 2018 में जनरेटिव प्री-ट्रेन ट्रांसफॉर्मर (GPT) शब्द गढ़ा। जनरेटिव का मतलब है कि मॉडल टेक्स्ट की तरह सामग्री उत्पन्न करेगा। हम भविष्य के लेख में "पूर्व-प्रशिक्षित" और "ट्रांसफार्मर" के बारे में अधिक बात करेंगे, लेकिन वे इस बारे में अधिक हैं कि एल्गोरिथ्म कैसे बनाया गया था, न कि यह क्या कर सकता है। लेकिन ये GPT-n चीजें (GPT-2, GPT-3, आदि) सिर्फ मॉडल हैं, विशेष रूप से बड़े भाषा मॉडल (एलएलएम)। एक एलएलएम टेक्स्ट लेता है, संभावित आउटपुट टेक्स्ट स्कोर करता है, फिर टेक्स्ट को उच्चतम स्कोर के साथ वापस देता है। वे चैटजीपीटी की तरह सीधे इंटरएक्टिव नहीं हैं।

अन्य बड़ी कंपनियों द्वारा बनाए गए अन्य एलएलएम हैं: उदाहरण के लिए Google के पास LaMDA है। ये नए "चैटबॉट टूल" मूल रूप से दो भाग हैं: वह हिस्सा जो आपके संकेत (चैटबॉट पर आपका संदेश) और स्वयं भाषा मॉडल लेता है। जब आप कोई वेब खोज करते हैं तो दोनों भाग एक-दूसरे से वैसे ही बात करते हैं जैसे आपका ब्राउज़र Google से बात करता है।

ChatGPT एक ऐसी वेबसाइट है जो पर्दे के पीछे GPT मॉडल से बात करती है। अन्य कंपनियाँ अपने स्वयं के उपकरण बना रही हैं जो GPT-n या ChatGPT मॉडल से बात करते हैं। उदाहरण के लिए, " नया बिंग " GPT-4 से बात करता है , जिसे 14 मार्च, 2023 को सार्वजनिक रूप से जारी किया गया था।

(8 अप्रैल को अपडेट करें: मुझे स्पष्ट करना चाहिए कि चैटजीपीटी उस मॉडल का नाम भी है जिससे चैटजीपीटी वेबसाइट बात करती है। इसे कई ओपनएआई डॉक्स में "जीपीटी-3.5-टर्बो" के रूप में सूचीबद्ध किया गया है , इसलिए आप लोगों को "चैटजीपीटी जीपीटी से बात करता है" कहते सुन सकते हैं। -3.5" या "ChatGPT एक GPT-3.5 मॉडल से बात करता है," दोनों आमतौर पर काफी करीब होते हैं।)

थोड़ा स्पर्शरेखा: Microsoft OpenAI का मुख्य भागीदार है । GPT-4 को Microsoft द्वारा निर्मित सुपरकंप्यूटर पर प्रशिक्षित किया गया था । वह सुपरकंप्यूटर दुनिया का पांचवां सबसे बड़ा है। और इसे सिर्फ OpenAI के लिए बनाया गया था। Microsoft ने लैब में अरबों डॉलर का निवेश किया है और कथित तौर पर जनवरी 2023 तक 49% शेयरधारक है। ओह, और GPT-3 को विशेष रूप से Microsoft के लिए लाइसेंस दिया गया है - इसका मतलब है कि Microsoft यह निर्धारित करता है कि चैटजीपीटी जैसे भविष्य के उपकरण कौन बनाता है और कौन नहीं बनाता है। उस मॉडल का उपयोग करना। मैं अभी तक GPT-4 की स्थिति के बारे में सुनिश्चित नहीं हूं, लेकिन अगर भविष्य के सभी GPT-n मॉडल केवल-Microsoft थे तो मुझे बहुत आश्चर्य नहीं होगा।

कंपनियां इतने सारे चैटबॉट टूल की घोषणा क्यों कर रही हैं? संक्षेप में, कई कंपनियों ने कुछ समय पहले एलएलएम की क्षमता को पहचाना, और ये उपकरण तब से काम कर रहे हैं। लेकिन चैटजीपीटी की अभूतपूर्व लोकप्रियता के साथ, इंजीनियरों को शायद अतिरिक्त क्षमता मिली, और तब से यह एक अच्छी तरह से प्रचारित दौड़ रही है।

उपकरण शक्तिशाली हैं क्योंकि वे इनपुट और आउटपुट दोनों के लिए सामान्य अंग्रेजी का उपयोग करते हैं । एक पारंपरिक खोज इंजन की तरह, हमें कंप्यूटर से बात करने का एक विशिष्ट तरीका याद रखने की आवश्यकता नहीं है: हम बस वही लिखते हैं जो हम सोचते हैं और हमें परिणाम मिलते हैं। इससे भी बेहतर, आउटपुट सादा अंग्रेजी भी है! उपयोगी लिंक्स (विज्ञापनों और) की सूची के बजाय, हमें बस... एक उत्तर मिलता है! OpenAI के मॉडल के इर्द-गिर्द निर्मित उपकरणों ने सचमुच खोज को खोज से बाहर कर दिया है। क्या आप बता सकते हैं कि मैं उत्साहित हूं? (साइड नोट: विशेषज्ञ "सादे अंग्रेजी" को "प्राकृतिक भाषा" कहते हैं।)

अंत में, इन उपकरणों की चौड़ाई और गहराई वास्तव में असीमित महसूस होती है। मुझे Microsoft की Microsoft 365 Copilot की घोषणा पर विश्वास हैखुद के लिए बोलता है, लेकिन अगर 40 मिनट का डेमो और अवलोकन आपके लिए बहुत अधिक है, तो मैं संक्षेप में बताऊंगा। Microsoft उन उपकरणों की शक्ति में विश्वास करता है जहाँ आप सादा अंग्रेजी इनपुट करते हैं, और यह उपयोगी जानकारी या यहाँ तक कि आपके दस्तावेज़ में एक उपयोगी संशोधन को आउटपुट करता है। कोपिलॉट मूल रूप से "ChatGPT है जिसकी आपके Microsoft 365 दस्तावेज़ों तक पहुँच है।" अपनी बेटी के ग्रेजुएशन के लिए 3 मिनट के ड्राफ्ट भाषण के लिए कोपिलॉट से पूछें, उसके अच्छे ग्रेड का उल्लेख करना सुनिश्चित करें, आपको उस पर कितना गर्व है, और आप उसके भविष्य के लिए कितने उत्साहित हैं, और आप इसे प्राप्त करेंगे। हाथों हाथ। कोई खोज नहीं, कोई कॉपी-पेस्ट नहीं, कुछ नहीं। "सह-पायलट" प्रतिमान का लक्ष्य उपयोगकर्ता को बिना किसी व्यस्त कार्य के बिना ड्राफ्ट और त्वरित सुधार विकल्प प्रदान करना है। अपने "एक्सेल मित्र" से पूछने के बजाय कि एक विशिष्ट सूत्र कैसे लिखना है (मैं आपको देख रहा हूं, पिताजी) या Google से परिणामों की छान-बीन करने की कोशिश कर रहे हैं, बस Copilot से पूछें। यह आपको केवल एक सूत्र नहीं देगा, यह आपके लिए इसकी कल्पना करेगा, इसके बारे में अतिरिक्त संदर्भ प्रदान करेगा, वैकल्पिक सुझाव प्रदान करेगा - कुछ भी! ठीक है, यह एक विज्ञापन की तरह लग रहा है (यह नहीं है), लेकिन मैं वास्तव में उत्साहित हूं। मैंने अभी तक कोपिलॉट का उपयोग नहीं किया है, लेकिन मैं इसके लिए उत्सुक हूं, और जब मैं कर सकता हूं, तो मैं वापस रिपोर्ट करूंगा। अगर तकनीक इस तरह काम करती है, तो "जस्ट गूगल इट" को "जस्ट आस्क कोपिलॉट" से बदल दिया जाएगा।

Microsoft अकेला नहीं है: Google ने Google कार्यक्षेत्र के लिए समान सुविधाओं की घोषणा की है, और दोनों कंपनियों ने अपने स्वयं के LLM-AI- संचालित अनुभव बनाने के लिए इंजीनियरों को सशक्त बनाने के लिए डेवलपर ढांचे के कुछ रूपों की घोषणा की है: Microsoft के पास सिमेंटिक कर्नेल है और Google के पास मेकरसुइट है । लिखते समय, Google के बार्ड ने अभी-अभी सार्वजनिक पूर्वावलोकन में प्रवेश किया है । मैंने अभी तक अमेज़ॅन, ऐप्पल या अन्य बड़ी टेक कंपनियों से ज्यादा कुछ नहीं सुना है, लेकिन यह केवल समय की बात है।

इसके अतिरिक्त, OpenAI ने GPT-4 के लिए 6 ग्राहक कहानियाँ प्रकाशित कीं : डुओलिंगो , खान अकादमी , आइसलैंड सरकार , स्ट्राइप , मॉर्गन स्टेनली और बी माई आइज़ । ये कहानियाँ "चैटबॉट टूल्स" से परे एलएलएम अनुप्रयोगों की विविधता को उजागर करती हैं जिनसे हम परिचित हैं। उम्मीद है कि यह तकनीक अधिक से अधिक अनूठे तरीकों से एकीकृत होना शुरू करेगी!

स्पष्ट रूप से, उद्योग के कई बड़े खिलाड़ियों का मानना ​​है कि ये नए चैटबॉट उपकरण उतने ही क्रांतिकारी होंगे जितने स्मार्टफोन रहे हैं। मैं उन पर विश्वास करने के इच्छुक हूं।

यह भाग 1 की समाप्ति है! मुझे उम्मीद है कि इस लेख ने आपको वर्तमान एआई परिदृश्य और निकट भविष्य में क्या हो सकता है, इसे समझने में मदद की है। यदि आपने अभी तक चैटजीपीटी का उपयोग नहीं किया है, तो आप मुफ्त में चैटजीपीटी का उपयोग कर सकते हैं, नए बिंग को आजमा सकते हैं , या अपने आस-पास किसी भी वीडियो वेबसाइट पर अंतहीन डेमो देख सकते हैं।

पढ़ने के लिए आपका शुक्रिया। आप आगे क्या सीखना चाहते हैं? मैं आपकी कैसे मदद कर सकता हूँ? टिप्पणियों में क्या है मुझे जानने दें!

पेश है इस श्रंखला का दूसरा लेख:

एआई एक गूढ़ शब्द है। यहाँ जानने के लिए वास्तविक शब्द हैं

यह स्पष्ट करने के लिए 8 अप्रैल को अपडेट किया गया कि चैटजीपीटी एक मॉडल और एक उत्पाद दोनों है।

उपशीर्षक जोड़ने के लिए 16 अप्रैल को अपडेट किया गया।

अधिक आकर्षक विशेष रुप से प्रदर्शित छवि के लिए 6 मई को अपडेट किया गया (नीली पृष्ठभूमि पर मस्तिष्क, रोबोट और विस्फोटक सिर इमोजी था)। साथ ही निष्कर्ष को अद्यतन किया और "नया बिंग" को "नया बिंग" में बदल दिया।

"संकेत" को परिभाषित करने और "माइक्रोसॉफ्ट स्वतंत्र" अस्वीकरण जोड़ने के लिए 7 मई को अपडेट करें।