Weka - डेटा लोड हो रहा है

इस अध्याय में, हम पहले टैब से शुरू करते हैं जिसका उपयोग आप डेटा को प्रीप्रोसेस करने के लिए करते हैं। यह सभी एल्गोरिदम के लिए सामान्य है जो आप मॉडल के निर्माण के लिए अपने डेटा पर लागू करेंगे और WEKA में सभी बाद के कार्यों के लिए एक सामान्य कदम है।

स्वीकार्य सटीकता प्रदान करने के लिए मशीन लर्निंग एल्गोरिदम के लिए, यह महत्वपूर्ण है कि आपको पहले अपना डेटा साफ़ करना चाहिए। इसका कारण यह है कि फ़ील्ड से एकत्र किए गए कच्चे डेटा में अशक्त मूल्य, अप्रासंगिक कॉलम और इतने पर हो सकते हैं।

इस अध्याय में, आप आगे के उपयोग के लिए कच्चे डेटा को प्रीप्रोसेस करने और स्वच्छ, सार्थक डेटासेट बनाने का तरीका जानेंगे।

सबसे पहले, आप डेटा फ़ाइल को WEKA एक्सप्लोरर में लोड करना सीखेंगे। डेटा को निम्न स्रोतों से लोड किया जा सकता है -

  • स्थानीय फाइल सिस्टम
  • Web
  • Database

इस अध्याय में, हम डेटा लोड करने के सभी तीन विकल्पों को विस्तार से देखेंगे।

स्थानीय फ़ाइल सिस्टम से डेटा लोड हो रहा है

मशीन लर्निंग टैब के तहत, जिसे आपने पिछले पाठ में पढ़ा था, आपको निम्नलिखित तीन बटन मिलेंगे -

  • खुली फाइल ...
  • यूआरएल खोलें ...
  • DB खोलें ...

पर क्लिक करें Open file... बटन। एक निर्देशिका नेविगेटर विंडो खुलती है जैसा कि निम्नलिखित स्क्रीन में दिखाया गया है -

अब, उस फ़ोल्डर पर नेविगेट करें जहां आपकी डेटा फ़ाइलें संग्रहीत हैं। WEKA स्थापना आपको प्रयोग करने के लिए कई नमूना डेटाबेस के साथ आती है। इनमें उपलब्ध हैंdata WEKA स्थापना का फ़ोल्डर।

सीखने के उद्देश्य के लिए, इस फ़ोल्डर से किसी भी डेटा फ़ाइल का चयन करें। फ़ाइल की सामग्री WEKA पर्यावरण में लोड की जाएगी। हम बहुत जल्द ही इस लोड किए गए डेटा का निरीक्षण और प्रक्रिया करना सीखेंगे। इससे पहले, आइए हम देखें कि वेब से डेटा फ़ाइल को कैसे लोड किया जाए।

वेब से डेटा लोड हो रहा है

एक बार जब आप पर क्लिक करें Open URL ... बटन, आप एक खिड़की को इस प्रकार देख सकते हैं -

हम एक सार्वजनिक URL से फ़ाइल खोलेंगे पॉपअप बॉक्स में निम्न URL टाइप करें -

https://storm.cis.fordham.edu/~gweiss/data-mining/weka-data/weather.nominal.arff

आप किसी अन्य URL को निर्दिष्ट कर सकते हैं जहां आपका डेटा संग्रहीत है। Explorer दूरस्थ साइट से डेटा को उसके वातावरण में लोड करेगा।

DB से डेटा लोड हो रहा है

एक बार जब आप पर क्लिक करें Open DB ... बटन, आप एक विंडो इस प्रकार देख सकते हैं -

अपने डेटाबेस के लिए कनेक्शन स्ट्रिंग सेट करें, डेटा चयन के लिए क्वेरी सेट करें, क्वेरी को संसाधित करें और WEKA में चयनित रिकॉर्ड लोड करें।