वेका - परिचय
किसी भी मशीन लर्निंग एप्लिकेशन की नींव डेटा है - न केवल एक छोटा डेटा, बल्कि एक बड़ा डेटा जो इसे करार दिया जाता है Big Data वर्तमान शब्दावली में।
बड़े डेटा का विश्लेषण करने के लिए मशीन को प्रशिक्षित करने के लिए, आपको डेटा पर कई विचार करने की आवश्यकता है -
- डेटा साफ होना चाहिए।
- इसमें शून्य मान नहीं होना चाहिए।
इसके अलावा, डेटा तालिका के सभी कॉलम उन प्रकारों के लिए उपयोगी नहीं होंगे जिन्हें आप प्राप्त करने की कोशिश कर रहे हैं। मशीन लर्निंग शब्दावली में अप्रासंगिक डेटा कॉलम या 'फीचर्स', जिसे मशीन लर्निंग एल्गोरिदम में डेटा फीड किए जाने से पहले हटा दिया जाना चाहिए।
संक्षेप में, मशीन लर्निंग के लिए उपयोग किए जाने से पहले आपके बड़े डेटा को बहुत अधिक प्रीप्रोसेसिंग की आवश्यकता होती है। डेटा तैयार होने के बाद, आप अपने अंत में समस्या को हल करने के लिए विभिन्न मशीन लर्निंग एल्गोरिदम जैसे कि वर्गीकरण, प्रतिगमन, क्लस्टरिंग आदि को लागू करेंगे।
आपके द्वारा लागू किए गए एल्गोरिदम का प्रकार आपके डोमेन ज्ञान पर काफी हद तक आधारित है। यहां तक कि एक ही प्रकार के भीतर, उदाहरण के वर्गीकरण के लिए, कई एल्गोरिदम उपलब्ध हैं। आप एक कुशल मशीन लर्निंग मॉडल बनाने के लिए एक ही वर्ग के तहत विभिन्न एल्गोरिदम का परीक्षण करना पसंद कर सकते हैं। ऐसा करते समय, आप संसाधित डेटा के विज़ुअलाइज़ेशन को पसंद करेंगे और इस प्रकार आपको विज़ुअलाइज़ेशन टूल की भी आवश्यकता होगी।
आने वाले अध्यायों में, आप वेका के बारे में जानेंगे, जो एक ऐसा सॉफ्टवेयर है जो आसानी से उपरोक्त सभी को पूरा करता है और आपको बड़े आराम से काम करने देता है।