एआई एक चर्चा है। यहां जानने के लिए वास्तविक शब्द हैं

May 08 2023
"एआई" तकनीक के आसपास के शब्दों का सादा अंग्रेजी विवरण
एआई और मशीन लर्निंग के अपने अवलोकन में, मैंने एआई को "कुछ ऐसा करने की क्षमता जो 'स्मार्ट लगती है' के रूप में परिभाषित किया। स्पॉयलर अलर्ट: मुझे पता है कि यह एक खराब परिभाषा है।
मुझे इन सभी एआई सामान से डर लगता है। बिंग इमेज क्रिएटर के साथ बनाया गया।

एआई और मशीन लर्निंग के अपने अवलोकन में , मैंने एआई को "कुछ ऐसा करने की क्षमता" के रूप में परिभाषित किया जो 'स्मार्ट लगता है।' स्पॉयलर अलर्ट: मुझे पता है कि यह एक खराब परिभाषा है। रियल स्पॉइलर अलर्ट: मुझे कोई अच्छा नहीं मिल रहा है। किसी ने ऐसा नहीं लिखा है जिस पर सभी सहमत हों । हम अभी के लिए "स्मार्ट लगता है" के साथ फंस गए हैं। लेकिन यह ठीक है, क्योंकि तकनीकी उद्योग के लोग वास्तव में यह नहीं कहते हैं कि "आइए एक एआई ऐप बनाएं," वे कहते हैं, "आइए मशीन लर्निंग के साथ इस समाधान को लागू करें" या "चलो सुनिश्चित करें कि हम मतिभ्रम से बचने के लिए उपयोगकर्ता के संकेतों को आधार बनाते हैं।"

एआई, एक शब्द के रूप में, केवल एक गूढ़ शब्द है। 90 के दशक में, डीप ब्लू बड़ा बुरा AI था जिसने गैरी कास्परोव, तत्कालीन विश्व शतरंज चैंपियन को उनके ही खेल में हरा दिया! आजकल, हालांकि, कई इसे एआई कहने में संकोच करेंगे: आखिरकार, इसमें से बहुत कुछ याद रखना था और बाकी प्रोग्रामर और शतरंज विशेषज्ञों द्वारा दिए गए निर्देशों का पालन करना था। क्या यह स्मार्ट है अगर यह सिर्फ निर्देशों का पालन कर रहा है? लेकिन एआई अच्छा लगता है! और यह निश्चित रूप से स्मार्ट लगता है, तो यह फिट बैठता है! यहां हम "एआई" शब्द का वास्तविक उद्देश्य देखते हैं: कार्यक्रमों को एक अच्छा नाम देना, "शतरंज याद रखना और निर्देश-निम्नलिखित कंप्यूटर" या "स्मार्ट-दिखने वाले नियम-अनुयायी" से बेहतर कुछ। "एआई" सब कुछ बड़े करीने से लपेटता है, और विपणक अक्सर उम्मीद करते हैं कि दर्शक वास्तव में कभी सवाल नहीं करते हैं कि पर्दे के पीछे क्या चल रहा है।

तो चलिए पर्दे के पीछे चलते हैं।

अस्वीकरण: इस आलेख में मेरे नियोक्ता Microsoft का उल्लेख है। मैंने यह लेख अपने खाली समय में लिखा था और सभी विचार मेरे अपने हैं।

आजकल, लगभग हर ऐप जिसे हम AI मानते हैं , मशीन लर्निंग नामक एक प्रक्रिया के माध्यम से बनाया गया है । इस शब्द के बारे में मेरे पहले के कवरेज को सारांशित करने के लिए , एक मशीन लर्निंग एल्गोरिथम उदाहरणों के आधार पर कार्य करने का अपना तरीका बनाता है। अभिनय के इस तरीके को एक मॉडल कहा जाता है , और यह खाना पकाने की विधि की तरह है। इंजीनियरों द्वारा हाथ से तैयार की गई रेसिपी के साथ एक पारंपरिक एल्गोरिदम प्रदान किया जाता है। हालांकि, इंजीनियर इमेज रिकग्निशन और कई अन्य समस्याओं के लिए हाथ से तैयार की गई रेसिपी बनाने में असमर्थ रहे हैं, इसलिए मशीन लर्निंग ने उन क्षेत्रों में दिन बचाए हैं।

मशीन लर्निंग के चार भाग रसोई से मेल खाते हैं - धन्यवाद कैसी! स्रोत: कैसी कोज़िरकोव

Cassie Kozyrkov की उत्कृष्ट रसोई सादृश्यता का उपयोग करने के लिए , किसी भी मशीन सीखने की प्रक्रिया के चार भाग होते हैं: डेटा इकट्ठा करें, इसे एक एल्गोरिथ्म में फीड करें, मॉडल को मान्य करें, और भविष्यवाणियों को पूरा करने के लिए इसका उपयोग करें। इसी तरह, रसोई में चार भाग होते हैं: सामग्री, उपकरण, व्यंजनों और व्यंजन। लेकिन मशीन लर्निंग "उपकरण" औसत ओवन की तुलना में बहुत अधिक स्मार्ट हैं - वे केवल भोजन को गर्म नहीं करते हैं, वे एक डिश तैयार करना सीखते हैं!

उदाहरण के लिए, चैटजीपीटी बनाने के लिए, ओपनएआई ने पूरे इंटरनेट से डेटा इकट्ठा किया और अपने स्वयं के कुछ नमूना वार्तालाप बनाए, इसे एक जनरेटिव पूर्व-प्रशिक्षित ट्रांसफॉर्मर (जीपीटी) एल्गोरिदम में फीड किया, एक अद्यतन जीपीटी-3.5 मॉडल के साथ सामने आया, और अब वे बातचीत में अगले शब्दों की भविष्यवाणी करने के लिए इसका इस्तेमाल करते हैं। (अप्रैल 8 को अपडेट करें: थोड़ा अतिरिक्त काम था: उन्होंने "खाना बनाते समय मॉडल पर जाँच की," इसलिए बोलने के लिए, मानव प्रतिक्रिया से सुदृढीकरण सीखने के रूप में जानी जाने वाली प्रक्रिया का उपयोग करने के साथ-साथ उपकरण की मदद करने के लिए। मैंने संशोधित भी किया है पिछला पैराग्राफ यह स्पष्ट करने के लिए कि चैटजीपीटी मूल जीपीटी-3.5 मॉडल से स्वतंत्र निर्मित एक मॉडल है।)

वास्तव में, मशीन लर्निंग का उपयोग हर जगह किया जाता है : ट्विटर की सिफारिश एल्गोरिथ्म (विवरण के लिए इसका "भारी रैंकर" देखें) से लेकर शायद हर दूसरी वेबसाइट की सिफारिश एल्गोरिदम से लेकर चिकित्सा निदान तक धोखाधड़ी का पता लगाने से लेकर खगोल विज्ञान और उससे आगे तक!

एक बड़ा भाषा मॉडल सिर्फ एक मशीन लर्निंग मॉडल है जिसे विशेष रूप से टेक्स्ट इनपुट के आधार पर आउटपुट टेक्स्ट के लिए प्रशिक्षित किया जाता है। बड़े भाषा मॉडल के कुछ उदाहरणों में GPT-3, GPT-3.5 और GPT-4 शामिल हैं (कभी-कभी इन्हें केवल GPT-n के रूप में संदर्भित किया जाता है)। Google द्वारा LaMDA , मेटा द्वारा LLaMA , और उस कंपनी द्वारा BloombergGPT भी है जो उस व्यक्ति के नाम पर सब कुछ नाम देता है। तकनीकी रूप से, GPT-n मॉडल प्रत्येक मॉडल का एक परिवार है , लेकिन अधिकांश लेख इसके सबसे अनुकूलित चैट मॉडल को संदर्भित करने के लिए "GPT-4" का उपयोग करते हैं।

कुछ उत्पाद जो बड़े भाषा मॉडल का उपयोग करते हैं , वे हैं चैटजीपीटी, जो जीपीटी-3.5* (अब ग्राहकों के लिए जीपीटी-4), नया बिंग (जीपीटी-4) और गूगल बार्ड (एलएएमडीए) का उपयोग करता है। बहुत आने की उम्मीद है, बहुत कुछ आने वाला है। और बस याद रखें: कोई भी व्यक्ति जो कहता है कि नया बिंग "ChatGPT द्वारा संचालित" है, वह बिल्कुल सही नहीं है — अब आप उन्हें सीखने में मदद कर सकते हैं!

*8 अप्रैल को अपडेट करें: तकनीकी रूप से, चैटजीपीटी भी मॉडल का नाम है , लेकिन इसे जीपीटी-3.5 मॉडल से ठीक-ठीक किया गया था और इसे ऐप पर ही "जीपीटी-3.5" और " जीपीटी-3.5-टर्बो " के रूप में संदर्भित किया गया है। संपूर्ण OpenAI प्रलेखन में .

एक उत्पाद एक मॉडल के चारों ओर एक आवरण है, एक मॉडल के साथ काम करना आसान बनाने और इसे अन्य चीजों के साथ एकीकृत करने का एक तरीका है, जैसे वेबसाइट और क्या नहीं। उत्पाद यह सुनिश्चित करने के लिए सुरक्षा, गोपनीयता और नीतिगत तर्क भी प्रदान करते हैं कि खराब संकेत मॉडल को नहीं भेजे जाते हैं और खराब आउटपुट आपको नहीं दिखाया जाता है। उत्पाद के मालिक तय करते हैं कि क्या "बुरा" है और क्या नहीं है, और वे आम तौर पर मानक घृणित, हिंसक, या सीधे सादे असभ्य भाषण से बचते हैं, अन्य बातों के अलावा। उत्पाद द्वारा स्वीकार किए गए संकेत आमतौर पर सीधे मॉडल को भेजे जाते हैं, हालांकि यह बदल रहा है।

नए प्रांप्ट-आधारित उत्पाद ग्राउंड प्रांप्ट करेंगे, जिसका अर्थ है कि वे मॉडल को देने से पहले उन्हें अधिक उपयोगी बनाने के लिए प्रांप्ट को समायोजित करेंगे ( 21:04 पर माइक्रोसॉफ्ट की हालिया घोषणा देखें)। ऐसा माना जाता है कि ग्राउंडेड प्रॉम्प्ट के परिणामस्वरूप मतिभ्रम होने की संभावना कम होती है । एक मॉडल जब भी कुछ ऐसा आउटपुट करता है जो सच लग सकता है, लेकिन ऐसा नहीं है, तो वह मतिभ्रम करता है। इस ऑनलाइन के बहुत सारे उदाहरण हैं, लेकिन नए बिंग के शुरुआती दिनों में केक लेते हैं: एक मामले में, यह दावा किया गया कि अवतार 2 अभी तक बाहर नहीं आया था और उपयोगकर्ता का अपमान करने के लिए आगे बढ़ा । (स्क्रीनशॉट और कहानियाँ गढ़ी जा सकती हैं, लेकिन मैंने अवतार 2 मतिभ्रम को स्वयं फिर से बनाया, हालाँकि मुझे अपमान नहीं हुआ।)

बार्ड के प्रसिद्ध $ 100 बिलियन मतिभ्रम- JWST ने एक एक्सोप्लैनेट की पहली तस्वीर नहीं ली, VLT ने ली।

मतिभ्रम सुनने में जितना खतरनाक लगता है, इसलिए यह याद रखना महत्वपूर्ण है कि मॉडलों को सच्चाई नहीं पता होती है । मॉडल केवल शब्दों का अनुमान लगाते हैं। यह उत्पाद पर निर्भर है, और अंततः उपयोगकर्ता, किसी भी चीज़ की तथ्य-जांच करने के लिए जो एक मॉडल आउटपुट करता है। एक और प्रसिद्ध मतिभ्रम Google से आता है: 6 फरवरी को, Google ने बार्ड का पहला सार्वजनिक उत्तर प्रदर्शित किया - और यह एक मतिभ्रम था। वे इसे समझ नहीं पाए और उन्होंने कोई अस्वीकरण नहीं डाला, और बाद में Google को बाजार मूल्य में $100 बिलियन का नुकसान हुआ । निष्पक्ष होने के लिए, पुरानी बिंग अभी भी वही गलती करता है जब मैं खोजता हूं "किस टेलीस्कोप ने एक एक्सोप्लैनेट की पहली छवि ली," लेकिन Google की अपने स्वयं के मॉडल की तथ्य-जांच करने में विफलता से पता चलता है कि मतिभ्रम पर विश्वास करना कितना आसान है। हमेशा तथ्य-जांच करें!

अंत में, आइए मॉडल बनाने वाले कुछ बुनियादी एल्गोरिदम को कवर करें। पहला एक न्यूरल नेटवर्क था , और फिर लोगों ने कन्वेन्शनल न्यूरल नेटवर्क और रिकरेंट न्यूरल नेटवर्क और जनरेटिव एडवरसैरियल न्यूरल नेटवर्क जैसी चीजों का निर्माण शुरू किया , लेकिन 2017 तक हमें नवीनतम एल्गोरिदम नहीं मिला: ट्रांसफॉर्मर , जो बहुत सरल है और बुनियादी समझ हासिल करने के लिए मुझे केवल एक दर्जन घंटे का गहन अध्ययन करना पड़ा।

क्या हमें यह जानने की ज़रूरत है कि इनमें से कोई भी एल्गोरिदम कैसे काम करता है? खैर, क्या हमें यह जानने की ज़रूरत है कि ओवन कैसे काम करता है? वास्तव में नहीं, हमें बस यह जानने की जरूरत है कि यह हमारे भोजन को पकाता है और जब यह गर्म होता है तो यह खतरनाक होता है! तकनीकी विवरण दिलचस्प हो सकते हैं, लेकिन यह सब एक ही गणित के एक समूह में बार-बार उबलता है, मैं वादा करता हूँ।

आइए एक अच्छी बुलेटेड शब्दावली में सब कुछ सारांशित करें, क्या हम?

  • आर्टिफिशियल इंटेलिजेंस (एआई): एक खराब-परिभाषित शब्द जिसका मूल रूप से अर्थ है "स्मार्ट लगता है," ज्यादातर मार्केटिंग में उपयोग किया जाता है।
  • मशीन लर्निंग (एमएल): वह प्रक्रिया जिसके माध्यम से कोडर एक प्रोग्राम बनाते हैं जो उदाहरण के द्वारा सीखता है, न कि निर्देश द्वारा।
  • एमएल एल्गोरिथम: एक बिट सॉफ्टवेयर जो एक इनपुट में हर बार एक मॉडल को परिष्कृत करता है।
  • मॉडल: एक गणित प्रक्रिया जो किसी चीज़ की भविष्यवाणी करने के लिए किसी दिए गए प्रकार के डेटा पर काम करती है।
  • जनरेटिव लार्ज लैंग्वेज मॉडल (एलएलएम): एक प्रकार का मॉडल जो भविष्यवाणी करता है कि आगे कौन सा टेक्स्ट आएगा।
  • उत्पाद: कोई भी सॉफ़्टवेयर एप्लिकेशन जो पर्दे के पीछे एलएलएम का उपयोग करता है।
  • संकेत: जब आप चैटजीपीटी पर जाते हैं और एक संदेश भेजते हैं, तो वह संदेश आपका संकेत होता है।
  • ग्राउंडिंग: एलएलएम के लिए इसे बेहतर बनाने के प्रयास में एक संकेत को समायोजित करना।
  • मतिभ्रम: जब एक एलएलएम में कुछ गलत हो जाता है, तो यह मतिभ्रम होता है - हमेशा तथ्यों की जांच करें!

पढ़ने के लिए आपका शुक्रिया। आप आगे क्या सीखना चाहेंगे? मैं आपकी कैसे मदद कर सकता हूँ?

यहाँ एक सुझाव दिया गया है, यह इस श्रृंखला का पहला लेख है:

आइए जानें आर्टिफिशियल इंटेलिजेंस के बारे में

और अगली प्रविष्टि:

शीघ्र इंजीनियरिंग के साथ चैटजीपीटी की शक्ति को अनलॉक करें

जेनरेटर पॉडकास्ट

जेनरेटर से अधिक

आपको AutoGPTs के बारे में जानने की आवश्यकता क्यों है यह प्राचीन यहूदी किंवदंती जेनेरेटिव AI के बारे में एक सतर्क कहानी है