सभी मशीन लर्निंग मॉडल

Jun 18 2022
एक शुरुआत के रूप में, आप जानना चाहते हैं कि मशीन लर्निंग में कौन से मॉडल और एल्गोरिदम उपलब्ध हैं जो हमारे काम को और आसान बनाते हैं। इसलिए इस लेख में, हम उन सभी मशीन लर्निंग मॉडल के बारे में जानेंगे जिनका उपयोग एक शुरुआत करने वाले को करना चाहिए।

एक शुरुआत के रूप में, आप जानना चाहते हैं कि मशीन लर्निंग में कौन से मॉडल और एल्गोरिदम उपलब्ध हैं जो हमारे काम को और आसान बनाते हैं।

इसलिए इस लेख में, हम उन सभी मशीन लर्निंग मॉडल के बारे में जानेंगे जिनका उपयोग एक शुरुआत करने वाले को करना चाहिए।

चूंकि मशीन लर्निंग मॉडल मुख्य रूप से 2 उपवर्गों में आते हैं , और फिर पर्यवेक्षित शिक्षण को या तो एक प्रतिगमन या वर्गीकरण मॉडल के रूप में उपवर्गीकृत किया जाता है ।

पर्यवेक्षित अध्ययन

अनुपयोगी शिक्षा

पर्यवेक्षित अध्ययन

पर्यवेक्षित शिक्षण में एक फ़ंक्शन सीखना शामिल है जो इनपुट-आउटपुट जोड़े के उदाहरण के आधार पर आउटपुट में इनपुट को मैप करता है।

वापसी

प्रतिगमन मॉडल में, आउटपुट निरंतर है।

रेखीय प्रतिगमन

रैखिक प्रतिगमन का विचार केवल एक ऐसी रेखा ढूंढ रहा है जो डेटा के लिए सबसे उपयुक्त हो। रैखिक प्रतिगमन के विस्तार में कई रैखिक प्रतिगमन शामिल हैं।

निर्णय वृक्ष

निर्णय वृक्ष एक लोकप्रिय मॉडल है, जिसका उपयोग संचालन अनुसंधान, रणनीतिक योजना और मशीन सीखने में किया जाता है। नीचे दिए गए प्रत्येक सर्कल को नोड कहा जाता है , और आपके पास जितने अधिक नोड होंगे, आपका निर्णय पेड़ उतना ही सटीक होगा (आमतौर पर)। निर्णय वृक्ष के अंतिम नोड, जहाँ निर्णय लिया जाता है, पेड़ के पत्ते कहलाते हैं

यादृच्छिक वन

रैंडम फ़ॉरेस्ट एक पहनावा सीखने की तकनीक है जो निर्णय वृक्षों का निर्माण करती है। रैंडम फ़ॉरेस्ट में मूल डेटा के बूटस्ट्रैप्ड डेटासेट का उपयोग करके कई निर्णय ट्री बनाना और निर्णय ट्री के प्रत्येक चरण में बेतरतीब ढंग से चर के सबसेट का चयन करना शामिल है। मॉडल तब प्रत्येक निर्णय वृक्ष की सभी भविष्यवाणियों के मोड का चयन करता है

तंत्रिका - तंत्र

एक तंत्रिका नेटवर्क अनिवार्य रूप से गणितीय समीकरणों का एक नेटवर्क है। यह एक या अधिक इनपुट चर लेता है, और समीकरणों के एक नेटवर्क के माध्यम से जाने पर, एक या अधिक आउटपुट चर में परिणाम होता है।

वर्गीकरण

वर्गीकरण मॉडल में, आउटपुट असतत है।

संभार तन्त्र परावर्तन

लॉजिस्टिक रिग्रेशन लीनियर रिग्रेशन के समान है, लेकिन इसका उपयोग परिमित संख्या के परिणामों की संभावना को मॉडल करने के लिए किया जाता है, आमतौर पर दो।

समर्थन वेक्टर यंत्र

एक सपोर्ट वेक्टर मशीन डेटा के दो वर्गों के बीच एक हाइपरप्लेन या एक सीमा खोजेगी जो दो वर्गों के बीच के अंतर को अधिकतम करती है। कई विमान दो वर्गों को अलग कर सकते हैं, लेकिन केवल एक विमान ही वर्गों के बीच के अंतर या दूरी को अधिकतम कर सकता है।

Naive Bayes

Naive Bayes डेटा साइंस में इस्तेमाल किया जाने वाला एक और लोकप्रिय क्लासिफायरियर है। इसके पीछे का विचार Bayes Theorem द्वारा संचालित है । लक्ष्य अधिकतम आनुपातिक संभावना के साथ उत्तम दर्जे का खोजना है ।

निर्णय वृक्ष, यादृच्छिक वन, तंत्रिका नेटवर्क

उपरोक्त के समान

अनुपयोगी शिक्षा

पर्यवेक्षित शिक्षण के विपरीत, अनुपयोगी शिक्षण का उपयोग लेबल किए गए परिणामों के संदर्भ के बिना इनपुट डेटा से निष्कर्ष निकालने और पैटर्न खोजने के लिए किया जाता है।

क्लस्टरिंग

क्लस्टरिंग एक अनुपयोगी तकनीक है जिसमें डेटा बिंदुओं का समूहीकरण, या क्लस्टरिंग शामिल है। यह अक्सर ग्राहक विभाजन, धोखाधड़ी का पता लगाने और दस्तावेज़ वर्गीकरण के लिए उपयोग किया जाता है। सामान्य क्लस्टरिंग तकनीकों में k- साधन क्लस्टरिंग , पदानुक्रमित क्लस्टरिंग , माध्य शिफ्ट क्लस्टरिंग और घनत्व-आधारित क्लस्टरिंग शामिल हैं।

प्रमुख कंपोनेंट विश्लेषण

प्रिंसिपल कंपोनेंट एनालिसिस (पीसीए) का उपयोग डेटा को आसानी से एक्सप्लोर करने और वेरिएबल की संख्या को कम करके विज़ुअलाइज़ करने के लिए किया जाता है। यह डेटा में अधिकतम विचरण को एक नई समन्वय प्रणाली में कैप्चर करके किया जाता है जिसमें कुल्हाड़ियों को प्रमुख घटक कहा जाता है।

निष्कर्ष

इस लेख में मुझे आशा है, आप लोगों को भविष्य के लेखों में उपयोग किए जाने वाले सभी सामान्य मशीन लर्निंग मॉडल के बारे में एक बुनियादी ज्ञान है , मैं आपको प्रत्येक मॉडल के बारे में अधिक बताऊंगा और उन पर एक व्यावहारिक परियोजना कर रहा हूं।