मशीन लर्निंग - Unsupervised
अब तक आपने जो देखा है वह मशीन को हमारे लक्ष्य का समाधान खोजने के लिए सीख रहा है। प्रतिगमन में, हम भविष्य के मूल्य का अनुमान लगाने के लिए मशीन को प्रशिक्षित करते हैं। वर्गीकरण में, हम मशीन को हमारे द्वारा परिभाषित श्रेणियों में एक अज्ञात वस्तु को वर्गीकृत करने के लिए प्रशिक्षित करते हैं। संक्षेप में, हम मशीनों का प्रशिक्षण कर रहे हैं ताकि यह हमारे डेटा एक्स के लिए वाई की भविष्यवाणी कर सके। एक विशाल डेटा सेट को देखते हुए और श्रेणियों का अनुमान न लगाते हुए, पर्यवेक्षित शिक्षण का उपयोग करके मशीन को प्रशिक्षित करना हमारे लिए मुश्किल होगा। क्या होगा यदि मशीन कई गीगाबाइट और टेराबाइट्स में चल रहे बड़े डेटा का विश्लेषण कर सकती है और हमें बता सकती है कि इस डेटा में इतनी अलग-अलग श्रेणियां हैं?
एक उदाहरण के रूप में, मतदाता के आंकड़ों पर विचार करें। प्रत्येक मतदाता से कुछ इनपुटों पर विचार करके (इन्हें एआई शब्दावली में विशेषताएं कहा जाता है), मशीन को यह अनुमान लगाने दें कि बहुत सारे मतदाता हैं जो एक्स राजनीतिक पार्टी को वोट देंगे और इतने सारे वाई को वोट करेंगे, और इसी तरह। इस प्रकार, सामान्य तौर पर, हम मशीन को डेटा पॉइंट X का एक बड़ा सेट दिए जाने के लिए कह रहे हैं, "आप मुझे एक्स के बारे में क्या बता सकते हैं?"। या यह एक सवाल हो सकता है कि "हम एक्स से बाहर कर सकते हैं पांच सबसे अच्छे समूह क्या हैं?" या यह भी हो सकता है "एक्स में सबसे अधिक बार एक साथ तीन विशेषताएं क्या होती हैं?"।
यह बिल्कुल अनसुनी हुई शिक्षा है।
Unsupervised Learning के लिए एल्गोरिदम
आइए अब हम अनसुनी मशीन लर्निंग में वर्गीकरण के लिए व्यापक रूप से उपयोग किए जाने वाले एल्गोरिदम में से एक पर चर्चा करते हैं।
k- साधन क्लस्टरिंग
संयुक्त राज्य अमेरिका में 2000 और 2004 के राष्ट्रपति चुनाव करीब - करीब थे। किसी भी उम्मीदवार को मिले लोकप्रिय वोट का सबसे बड़ा प्रतिशत 50.7% और सबसे कम 47.9% था। यदि मतदाताओं के प्रतिशत का पक्ष बदल दिया जाता, तो चुनाव के परिणाम भिन्न होते। मतदाताओं के छोटे समूह हैं, जो जब ठीक से अपील करते हैं, तो पक्षों को बदल देंगे। ये समूह विशाल नहीं हो सकते हैं, लेकिन इस तरह के करीबी दौड़ के साथ, वे चुनाव के परिणाम को बदलने के लिए काफी बड़े हो सकते हैं। आप लोगों के इन समूहों को कैसे ढूंढते हैं? आप सीमित बजट के साथ उनसे कैसे अपील करते हैं? जवाब है क्लस्टरिंग।
आइए हम समझते हैं कि यह कैसे किया जाता है।
सबसे पहले, आप उन लोगों के बारे में या उनकी सहमति के बिना जानकारी एकत्र करते हैं: किसी भी प्रकार की जानकारी जो उनके बारे में कुछ संकेत दे सकती है कि उनके लिए क्या महत्वपूर्ण है और वे कैसे मतदान करते हैं, पर क्या प्रभाव पड़ेगा।
फिर आप इस जानकारी को किसी प्रकार के क्लस्टरिंग एल्गोरिथ्म में डालते हैं।
अगला, प्रत्येक क्लस्टर के लिए (यह सबसे बड़ा एक को चुनने के लिए स्मार्ट होगा) आप एक संदेश भेजते हैं जो इन मतदाताओं से अपील करेगा।
अंत में, आप अभियान वितरित करते हैं और यह देखने के लिए मापते हैं कि क्या यह काम कर रहा है।
क्लस्टरिंग एक प्रकार की अप्रशिक्षित शिक्षा है जो स्वचालित रूप से समान चीजों के समूह बनाती है। यह स्वचालित वर्गीकरण की तरह है। आप लगभग कुछ भी क्लस्टर कर सकते हैं, और क्लस्टर में जितने अधिक आइटम होंगे, क्लस्टर उतने ही बेहतर होंगे। इस अध्याय में, हम एक प्रकार के क्लस्टरिंग एल्गोरिथ्म का अध्ययन करने जा रहे हैं, जिसे k- साधन कहा जाता है। इसे k-Means कहा जाता है क्योंकि यह 'k' अद्वितीय क्लस्टर पाता है, और प्रत्येक क्लस्टर का केंद्र उस क्लस्टर में मान का मतलब है।
क्लस्टर पहचान
क्लस्टर पहचान एक एल्गोरिथ्म बताता है, “यहाँ कुछ डेटा है। अब समान चीजों को एक साथ समूहित करें और मुझे उन समूहों के बारे में बताएं। " वर्गीकरण से महत्वपूर्ण अंतर यह है कि वर्गीकरण में आप जानते हैं कि आप क्या देख रहे हैं। जबकि ऐसा नहीं है कि क्लस्टरिंग में मामला है।
क्लस्टरिंग को कभी-कभी अप्रमाणित वर्गीकरण भी कहा जाता है क्योंकि यह उसी परिणाम को उत्पन्न करता है जैसे वर्गीकरण करता है लेकिन पूर्वनिर्धारित कक्षाओं के बिना।
अब, हम पर्यवेक्षित और अनुपयोगी शिक्षा दोनों के साथ सहज हैं। मशीन सीखने की बाकी श्रेणियों को समझने के लिए, हमें पहले कृत्रिम तंत्रिका नेटवर्क (एएनएन) को समझना चाहिए, जिसे हम अगले अध्याय में जानेंगे।