मशीन-लर्निंग सिस्टम का रहस्योद्घाटन: प्राकृतिक भाषा में तंत्रिका नेटवर्क घटकों का स्वचालित रूप से वर्णन करना

Feb 09 2022

परिणामस्वरूप एक अन्य तकनीक सामान्य भाषा में दर्शाती है कि तंत्रिका संगठन के एकवचन भाग क्या करते हैं। तंत्रिका संगठनों को अब और बार-बार गुप्त तत्व कहा जाता है, क्योंकि वे विशिष्ट कार्यों पर लोगों को कैसे हरा सकते हैं, यहां तक कि वैज्ञानिक जो उनकी योजना बनाते हैं वे अक्सर असफल होते हैं कि वे कैसे या क्यों सराहनीय कार्य करते हैं।

साभार: फोटो शोधकर्ताओं के सौजन्य से, जोस-लुइस ओलिवारेस, एमआईटी द्वारा संपादित

परिणामस्वरूप एक अन्य तकनीक सामान्य भाषा में दर्शाती है कि तंत्रिका संगठन के एकवचन भाग क्या करते हैं।

तंत्रिका संगठनों को अब और बार-बार गुप्त तत्व कहा जाता है, क्योंकि वे विशिष्ट कार्यों पर लोगों को कैसे हरा सकते हैं, यहां तक कि वैज्ञानिक जो उनकी योजना बनाते हैं वे अक्सर असफल होते हैं कि वे कैसे या क्यों सराहनीय कार्य करते हैं। फिर भी, यह मानते हुए कि एक तंत्रिका संगठन प्रयोगशाला के बाहर प्रयोग किया जाता है, शायद नैदानिक तस्वीरों को समूहित करने के लिए जो हृदय की स्थिति का निदान करने में सहायता कर सकते हैं, यह महसूस करते हुए कि मॉडल कैसे काम करता है, वैज्ञानिकों को यह अनुमान लगाने में सहायता करता है कि यह व्यावहारिक रूप से कैसे कार्य करेगा।

एमआईटी विश्लेषकों ने अब एक ऐसी तकनीक को बढ़ावा दिया है जो ब्लैक बॉक्स तंत्रिका संगठनों की आंतरिक गतिविधियों में कुछ अंतर्दृष्टि प्रकट करती है। मानव मन से प्रदर्शित, तंत्रिका संगठनों को परस्पर जुड़े हब, या "न्यूरॉन्स" की परतों में व्यवस्थित किया जाता है, जो कि बातचीत की जानकारी है। नया ढांचा इसके परिणामस्वरूप अंग्रेजी या किसी अन्य नियमित भाषा में उत्पादित उन एकवचन न्यूरॉन्स के चित्रण प्रदान कर सकता है।

उदाहरण के लिए, चित्रों में प्राणियों को देखने के लिए तैयार एक तंत्रिका संगठन में, उनकी तकनीक लोमड़ियों के कानों की पहचान के रूप में एक विशिष्ट न्यूरॉन को चित्रित कर सकती है। उनकी अनुकूलनीय रणनीति अलग-अलग तकनीकों की तुलना में अलग-अलग न्यूरॉन्स के लिए अधिक सटीक चित्रण कर सकती है।

एक अन्य पेपर में, समूह दिखाता है कि यह तकनीक एक तंत्रिका संगठन की समीक्षा कर सकती है ताकि यह पता लगाया जा सके कि उसने क्या महसूस किया है, या यहां तक कि किसी संगठन को पहचानने और बाद में व्यर्थ या गलत न्यूरॉन्स को बंद करके बदल सकता है।

"हमें एक ऐसी तकनीक बनाने की ज़रूरत थी जहां एक एआई विशेषज्ञ इस ढांचे को अपना मॉडल दे सके और यह उन सभी को बताएगा कि वह उस मॉडल से परिचित है, मॉडल के न्यूरॉन्स के दृष्टिकोण के अनुसार, भाषा में। यह आपको आवश्यक पूछताछ का जवाब देने में सहायता करता है, 'क्या ऐसा कुछ है जिससे मेरा मॉडल परिचित है जिसे मैंने उम्मीद नहीं की होगी कि उसे पता होना चाहिए?'" एमआईटी सॉफ्टवेयर इंजीनियरिंग और मानव निर्मित तर्क अनुसंधान में एक पूर्व छात्र इवान हर्नांडेज़ कहते हैं सुविधा (CSAIL) और कागज के प्रमुख निर्माता।

सह-रचनाकारों ने सीएसएएल में पोस्टडॉक सारा श्वार्टमैन को शामिल किया; डेविड बाउ, एक नया CSAIL स्नातक जो नॉर्थईस्टर्न कॉलेज में सॉफ्टवेयर इंजीनियरिंग के निकट सहयोगी शिक्षक हैं; तेओना बेगश्विली, CSAIL में पिछली बार आने वाली छात्रा; एंटोनियो टॉरल्बा, इलेक्ट्रिकल डिजाइनिंग और सॉफ्टवेयर इंजीनियरिंग के डेल्टा हार्डवेयर शिक्षक, और CSAIL के एक व्यक्ति; और वरिष्ठ निर्माता जैकब एंड्री, CSAIL में एक्स कंसोर्टियम पार्टनर एजुकेटर। परीक्षा को लर्निंग पोर्ट्रेट्स पर ग्लोबल मीटिंग में पेश किया जाएगा।

परिणामस्वरूप निर्मित चित्रण
अधिकांश मौजूदा प्रक्रियाएं जो एआई पेशेवरों को यह देखने में मदद करती हैं कि एक मॉडल कैसे काम करता है या तो पूरे तंत्रिका संगठन को चित्रित करता है या विश्लेषकों से उन विचारों को अलग करने की अपेक्षा करता है जो वे मानते हैं कि व्यक्तिगत न्यूरॉन्स शून्य हो सकते हैं।

हर्नान्डेज़ और उनके सहयोगियों ने बनाया, जिसका नाम मिलन (न्यूरॉन्स की सामान्य डेटा निर्देशित सिमेंटिक टिप्पणी) है, इन तकनीकों को परिष्कृत करता है क्योंकि इसे समय से पहले विचारों के एक ठहरने की आवश्यकता नहीं होती है और परिणामस्वरूप न्यूरॉन्स की सापेक्ष भीड़ के सामान्य भाषा चित्रण का उत्पादन कर सकते हैं। एक संस्था। यह महत्वपूर्ण है क्योंकि एक तंत्रिका संगठन में अनगिनत व्यक्तिगत न्यूरॉन्स हो सकते हैं।

MILAN लेख पावती और चित्र मिश्रण जैसे पीसी विज़न कार्यों के लिए तैयार तंत्रिका संगठनों में न्यूरॉन्स के चित्रण का उत्पादन करता है। एक न्यूरॉन को चित्रित करने के लिए, ढांचा शुरू में कई चित्रों पर उस न्यूरॉन के आचरण की जांच करता है ताकि चित्र जिलों की व्यवस्था का निरीक्षण किया जा सके जिसमें न्यूरॉन गतिशील है। फिर, यह प्रत्येक न्यूरॉन के लिए चित्र जिलों और चित्रणों के बीच बिंदु-वार साझा डेटा नामक राशि का विस्तार करने के लिए एक विशिष्ट भाषा चित्रण चुनता है। यह उन चित्रणों का समर्थन करता है जो बड़े संगठन के अंदर प्रत्येक न्यूरॉन के विशेष कार्य को पकड़ते हैं।

"एक तंत्रिका संगठन में जो समूह चित्रों के लिए तैयार है, वहां विभिन्न न्यूरॉन्स का भारी भार होगा जो कुत्ते की पहचान करते हैं। यहाँ विभिन्न प्रकार के कैनाइन और विभिन्न प्रकार के कैनाइन के ढेर हैं। इसलिए हालांकि 'कैनाइन' इन न्यूरॉन्स के एक टन का सटीक चित्रण हो सकता है, यह असाधारण रूप से शिक्षाप्रद नहीं है। हमें ऐसे चित्रणों की आवश्यकता है जो कि न्यूरॉन क्या कर रहा है, इसके लिए बिल्कुल निश्चित हैं। यह केवल कुत्ते नहीं है; यह जर्मन चरवाहों के कानों का बायां आधा हिस्सा है, ”हर्नांडेज़ कहते हैं।

समूह ने विभिन्न मॉडलों के साथ मिलन की तुलना की और देखा कि इसने अधिक असाधारण और अधिक सटीक चित्रण बनाए, हालांकि वैज्ञानिक यह जानने के लिए अधिक उत्सुक थे कि यह पीसी विज़न मॉडल के बारे में स्पष्ट पूछताछ का जवाब देने में कैसे मदद कर सकता है।

तंत्रिका संगठनों की जांच, समीक्षा और परिवर्तन
करने के लिए MILAN का उपयोग यह जांचने के लिए किया जाता है कि तंत्रिका संगठन में कौन से न्यूरॉन्स सबसे महत्वपूर्ण हैं। उन्होंने प्रत्येक न्यूरॉन के लिए चित्रण बनाए और चित्रण में शब्दों को ध्यान में रखते हुए उन्हें व्यवस्थित किया। उन्होंने धीरे-धीरे संगठन से न्यूरॉन्स को समाप्त कर दिया, यह समझने के लिए कि इसकी सटीकता कैसे बदल गई, और उन न्यूरॉन्स को ट्रैक किया जिनके चित्रण में दो पूरी तरह से अलग शब्द थे (उदाहरण के लिए कंटेनर और जीवाश्म) संगठन के लिए कम आवश्यक थे।

उन्होंने मॉडल की समीक्षा करने के लिए मिलान का उपयोग यह जांचने के लिए भी किया कि क्या उन्हें कुछ चौंकाने वाली जानकारी मिली है। वैज्ञानिकों ने चित्र व्यवस्था मॉडल लिए जो डेटासेट पर तैयार किए गए थे जिसमें मानव उपस्थिति अस्पष्ट थी, मिलन चलाया, और गिना गया कि न्यूरॉन्स की संख्या मानव चेहरे के लिए नाजुक थी।

"इस तरह से चेहरों को अस्पष्ट करने से न्यूरॉन्स की संख्या कम हो जाती है जो चेहरे के लिए संवेदनशील होते हैं, लेकिन उनके निपटान से बहुत दूर हैं। वास्तव में, हम अनुमान लगाते हैं कि इन चेहरे के न्यूरॉन्स का एक हिस्सा स्पष्ट खंड सभाओं के लिए असाधारण रूप से स्पर्श करता है, जो बहुत ही आश्चर्यजनक है। इन मॉडलों ने कभी मानव चेहरा नहीं देखा है, लेकिन फिर उनके अंदर चेहरे की एक विस्तृत श्रृंखला होती है, "हर्नांडेज़ कहते हैं।

तीसरी परीक्षा में, समूह ने सूचना में भयानक कनेक्शन को पहचानने वाले न्यूरॉन्स को ढूंढकर और हटाकर एक तंत्रिका संगठन को बदलने के लिए MILAN का उपयोग किया, जिससे जोखिम भरे संबंध दिखाने वाले इनपुट पर संगठन की सटीकता में 5 प्रतिशत का विस्तार हुआ।

जबकि वैज्ञानिक इन तीन अनुप्रयोगों में मिलन ने कितनी अच्छी तरह से काम किया था, इस बारे में चिंतित थे, मॉडल बार-बार ऐसे चित्रण देता है जो अभी भी अत्यधिक अस्पष्ट हैं, या यह एक गलत विचार करेगा जब उसके पास उस विचार के बारे में सबसे अस्पष्ट विचार नहीं होगा जिसे इसे करना चाहिए पहचानना।

भविष्य के काम में इन सीमाओं को संबोधित करना चाहते हैं। उन्हें अतिरिक्त रूप से मिलन द्वारा बनाए जा सकने वाले चित्रणों की भव्यता में सुधार करते रहने की आवश्यकता है। वे विभिन्न तंत्रिका संगठनों के लिए मिलन को लागू करने की इच्छा रखते हैं और इसका उपयोग यह दर्शाने के लिए करते हैं कि न्यूरॉन्स के समूह न्यूरॉन्स के साथ कैसे व्यवहार करते हैं और परिणाम देने में सहयोग करते हैं।

"यह आधार से शुरू होने वाली व्याख्यात्मकता से निपटने का एक तरीका है। इसका उद्देश्य नियमित भाषा के साथ क्षमता के खुले-तैयार, रचनात्मक चित्रण तैयार करना है। हमें ऐसे चित्रण बनाने के लिए मानव भाषा के अभिव्यंजक प्रभाव का लाभ उठाने की आवश्यकता है जो न्यूरॉन्स के लिए बहुत अधिक नियमित और समृद्ध हैं। श्वार्टमैन कहते हैं, "विभिन्न प्रकार के मॉडलों से निपटने के लिए इस तरह से योग करने का विकल्प मेरे लिए तैयार है।"

एंड्रियास कहते हैं, "उचित कंप्यूटर आधारित खुफिया के लिए किसी भी विधि का एक निश्चित परीक्षण यह है कि क्या यह विश्लेषकों और ग्राहकों को नकली खुफिया ढांचे को कब और कैसे भेजना है, इसके बारे में बेहतर विकल्प तय करने में सहायता कर सकता है।" "हम अभी तक समग्र रूप से ऐसा करने का विकल्प रखने से बहुत दूर हैं। आशा है कि मिलन - और एक उदाहरणात्मक उपकरण के रूप में भाषा का उपयोग सभी अधिक व्यापक रूप से - टूल स्टैश का एक सहायक टुकड़ा होगा।" संदर्भ: इवान हर्नांडेज़, सारा श्वेटमैन, डेविड बाउ द्वारा "डीप विज़ुअल फीचर्स का प्राकृतिक भाषा विवरण"। Teona Bagashvili, एंटोनियो Torralba और याकूब एंड्रियास, 26 जनवरी 2022, कंप्यूटर विज्ञान> कंप्यूटर विजन और पैटर्न पहचान ।
arXiv:2201.11114

इस काम को आंशिक रूप से MIT-IBM Watson AI Lab और SystemsThatLearn@CSAIL पहल द्वारा वित्त पोषित किया गया था ।