वीका - फ़ीचर चयन
जब एक डेटाबेस में बड़ी संख्या में विशेषताएँ होती हैं, तो कई विशेषताएं होंगी जो उस विश्लेषण में महत्वपूर्ण नहीं बनती हैं जो आप वर्तमान में मांग रहे हैं। इस प्रकार, एक अच्छी मशीन लर्निंग मॉडल को विकसित करने में डेटासेट से अवांछित विशेषताओं को हटाना एक महत्वपूर्ण कार्य बन जाता है।
आप संपूर्ण डेटासेट को नेत्रहीन रूप से देख सकते हैं और अप्रासंगिक विशेषताओं पर निर्णय ले सकते हैं। यह डेटाबेस केस के लिए बड़ी संख्या में विशेषताओं वाला एक बड़ा काम हो सकता है जैसे सुपरमार्केट केस जिसे आपने पहले पाठ में देखा था। सौभाग्य से, WEKA सुविधा चयन के लिए एक स्वचालित उपकरण प्रदान करता है।
यह अध्याय बड़ी संख्या में विशेषताओं वाले डेटाबेस पर इस सुविधा को प्रदर्शित करता है।
डेटा लोड हो रहा है
में Preprocess WEKA एक्सप्लोरर का टैग, का चयन करें labor.arffसिस्टम में लोड करने के लिए फ़ाइल। जब आप डेटा लोड करते हैं, तो आपको निम्न स्क्रीन दिखाई देगी -
ध्यान दें कि 17 विशेषताएँ हैं। हमारा कार्य हमारे विश्लेषण के लिए अप्रासंगिक कुछ विशेषताओं को समाप्त करके एक कम डेटासेट बनाना है।
सुविधाएँ निकालना
पर क्लिक करें Select attributesTAB. आप निम्न स्क्रीन देखेंगे -
के नीचे Attribute Evaluator तथा Search Method, आपको कई विकल्प मिलेंगे। हम यहां केवल डिफॉल्ट का उपयोग करेंगे। मेंAttribute Selection Mode, पूर्ण प्रशिक्षण सेट विकल्प का उपयोग करें।
डेटासेट को संसाधित करने के लिए प्रारंभ बटन पर क्लिक करें। आप निम्न आउटपुट देखेंगे -
परिणाम विंडो के निचले भाग में, आपको सूची मिलेगी Selectedजिम्मेदार बताते हैं। दृश्य प्रतिनिधित्व प्राप्त करने के लिए, परिणाम पर राइट क्लिक करेंResult सूची।
आउटपुट को निम्न स्क्रीनशॉट में दिखाया गया है -
किसी भी वर्ग पर क्लिक करने से आपको अपने आगे के विश्लेषण के लिए डेटा प्लॉट मिलेगा। एक विशिष्ट डेटा प्लॉट नीचे दिखाया गया है -
यह उन लोगों के समान है जिन्हें हमने पहले के अध्यायों में देखा है। परिणामों का विश्लेषण करने के लिए उपलब्ध विभिन्न विकल्पों के साथ खेलें।
आगे क्या होगा?
आपने अभी तक तेजी से विकसित हो रहे मशीन लर्निंग मॉडल में WEKA की शक्ति देखी है। हमने जो प्रयोग किया वह एक ग्राफिकल टूल हैExplorerइन मॉडलों को विकसित करने के लिए। WEKA एक कमांड लाइन इंटरफ़ेस भी प्रदान करता है जो आपको एक्सप्लोरर में प्रदान की गई तुलना में अधिक शक्ति प्रदान करता है।
क्लिक कर रहा है Simple CLI जी में बटनUI Chooser एप्लिकेशन इस कमांड लाइन इंटरफ़ेस को शुरू करता है जो नीचे स्क्रीनशॉट में दिखाया गया है -
नीचे दिए गए इनपुट बॉक्स में अपने कमांड टाइप करें। आप वह सब कर पाएंगे जो आपने अब तक एक्सप्लोरर में किया है। अधिक जानकारी के लिए WEKA प्रलेखन (https://www.cs.waikato.ac.nz/ml/weka/documentation.html) देखें।
अंत में, WEKA जावा में विकसित किया गया है और इसके एपीआई के लिए एक इंटरफ़ेस प्रदान करता है। इसलिए यदि आप एक जावा डेवलपर हैं और अपनी खुद की जावा परियोजनाओं में WEKA एमएल कार्यान्वयन को शामिल करने के लिए उत्सुक हैं, तो आप इतनी आसानी से कर सकते हैं।
निष्कर्ष
WEKA मशीन लर्निंग मॉडल विकसित करने के लिए एक शक्तिशाली उपकरण है। यह कई सबसे व्यापक रूप से उपयोग किए जाने वाले एमएल एल्गोरिदम का कार्यान्वयन प्रदान करता है। इन एल्गोरिदम को आपके डेटासेट में लागू करने से पहले, यह आपको डेटा को प्रीप्रोसेस करने की भी अनुमति देता है। समर्थित एल्गोरिथम के प्रकार वर्गीकृत, क्लस्टर, एसोसिएट और चयन विशेषताओं के अंतर्गत वर्गीकृत किए गए हैं। प्रसंस्करण के विभिन्न चरणों में परिणाम एक सुंदर और शक्तिशाली दृश्य प्रतिनिधित्व के साथ कल्पना की जा सकती है। इससे डेटा साइंटिस्ट के लिए अपने डेटासेट पर विभिन्न मशीन लर्निंग तकनीकों को जल्दी से लागू करना, परिणामों की तुलना करना और अंतिम उपयोग के लिए सबसे अच्छा मॉडल बनाना आसान हो जाता है।