वीका क्या है?
WEKA - एक ओपन सोर्स सॉफ़्टवेयर डेटा प्रीप्रोसेसिंग, कई मशीन लर्निंग एल्गोरिदम के कार्यान्वयन और विज़ुअलाइज़ेशन टूल के लिए उपकरण प्रदान करता है ताकि आप मशीन सीखने की तकनीक विकसित कर सकें और उन्हें वास्तविक दुनिया डेटा खनन समस्याओं पर लागू कर सकें। WEKA के प्रस्ताव को निम्नलिखित चित्र में संक्षेप में प्रस्तुत किया गया है -
यदि आप छवि के प्रवाह की शुरुआत का निरीक्षण करते हैं, तो आप समझेंगे कि बिग डेटा से निपटने के लिए कई चरण हैं जो मशीन के लिए उपयुक्त हैं -
सबसे पहले, आप फ़ील्ड से एकत्र किए गए कच्चे डेटा के साथ शुरू करेंगे। इस डेटा में कई अशक्त मूल्य और अप्रासंगिक क्षेत्र हो सकते हैं। आप डेटा को साफ करने के लिए WEKA में दिए गए डेटा प्रीप्रोसेसिंग टूल का उपयोग करते हैं।
फिर, आप एमएल एल्गोरिदम लागू करने के लिए अपने स्थानीय भंडारण में पूर्वप्रक्रमित डेटा को बचाएंगे।
इसके बाद, आप जिस तरह के एमएल मॉडल को विकसित करने की कोशिश कर रहे हैं, उसके आधार पर आप इस तरह के विकल्पों में से एक का चयन करेंगे Classify, Cluster, या Associate। Attributes Selection कम डेटासेट बनाने के लिए सुविधाओं के स्वत: चयन की अनुमति देता है।
ध्यान दें कि प्रत्येक श्रेणी के तहत, WEKA कई एल्गोरिदम का कार्यान्वयन प्रदान करता है। आप अपनी पसंद का एक एल्गोरिथ्म चुनेंगे, वांछित पैरामीटर सेट करेंगे और इसे डेटासेट पर चलाएंगे।
फिर, WEKA आपको मॉडल प्रोसेसिंग का सांख्यिकीय आउटपुट देगा। यह आपको डेटा का निरीक्षण करने के लिए एक विज़ुअलाइज़ेशन टूल प्रदान करता है।
विभिन्न मॉडलों को एक ही डाटासेट पर लागू किया जा सकता है। फिर आप विभिन्न मॉडलों के आउटपुट की तुलना कर सकते हैं और अपने उद्देश्य को पूरा करने वाले सर्वश्रेष्ठ का चयन कर सकते हैं।
इस प्रकार, WEKA के उपयोग से मशीन सीखने के मॉडल का तेजी से विकास होता है।
अब जब हमने देखा है कि WEKA क्या है और यह क्या करता है, तो अगले अध्याय में हम जानें कि WEKA को अपने स्थानीय कंप्यूटर पर कैसे स्थापित करें।