चंचल डेटा विज्ञान - भविष्यवाणियों की भूमिका
इस अध्याय में, हम चुस्त डेटा विज्ञान में भविष्यवाणियों की भूमिका के बारे में अर्जित करेंगे। इंटरेक्टिव रिपोर्ट डेटा के विभिन्न पहलुओं को उजागर करती है। भविष्यवाणियां फुर्तीली स्प्रिंट की चौथी परत बनाती हैं।
भविष्यवाणियां करते समय, हम हमेशा पिछले डेटा का उल्लेख करते हैं और भविष्य के पुनरावृत्तियों के लिए इनफ़ॉर्मेशन के रूप में उपयोग करते हैं। इस पूरी प्रक्रिया में, हम ऐतिहासिक डेटा के बैच प्रसंस्करण से डेटा को भविष्य के बारे में वास्तविक समय के डेटा में परिवर्तित करते हैं।
भविष्यवाणियों की भूमिका में निम्नलिखित शामिल हैं -
पूर्वानुमानों में पूर्वानुमान मदद करते हैं। कुछ पूर्वानुमान सांख्यिकीय अनुमान पर आधारित हैं। कुछ भविष्यवाणियाँ पंडितों की राय पर आधारित हैं।
सांख्यिकीय निष्कर्ष सभी प्रकार की भविष्यवाणियों के साथ शामिल हैं।
कभी-कभी पूर्वानुमान सटीक होते हैं, जबकि कभी-कभी पूर्वानुमान गलत होते हैं।
भविष्यिक विश्लेषण
प्रीडिक्टिव एनालिटिक्स में प्रेडिक्टिव मॉडलिंग, मशीन लर्निंग और डेटा माइनिंग से कई तरह की सांख्यिकीय तकनीकें शामिल हैं जो भविष्य और अज्ञात घटनाओं के बारे में भविष्यवाणियां करने के लिए वर्तमान और ऐतिहासिक तथ्यों का विश्लेषण करती हैं।
प्रिडिक्टिव एनालिटिक्स के लिए प्रशिक्षण डेटा की आवश्यकता होती है। प्रशिक्षित डेटा में स्वतंत्र और निर्भर विशेषताएं शामिल हैं। आश्रित विशेषताएं वे मान हैं जो एक उपयोगकर्ता भविष्यवाणी करने की कोशिश कर रहा है। स्वतंत्र विशेषताएं उन सुविधाओं का वर्णन करने वाली विशेषताएं हैं, जिन पर हम निर्भर सुविधाओं के आधार पर भविष्यवाणी करना चाहते हैं।
सुविधाओं के अध्ययन को फीचर इंजीनियरिंग कहा जाता है; यह भविष्यवाणी करने के लिए महत्वपूर्ण है। डेटा विज़ुअलाइज़ेशन और खोजपूर्ण डेटा विश्लेषण फ़ीचर इंजीनियरिंग के भाग हैं; इनका मूल रूप हैAgile data science।
पूर्वानुमान करना
चुस्त डेटा विज्ञान में भविष्यवाणियां करने के दो तरीके हैं -
Regression
Classification
एक प्रतिगमन या एक वर्गीकरण का निर्माण पूरी तरह से व्यावसायिक आवश्यकताओं और उसके विश्लेषण पर निर्भर करता है। निरंतर चर की भविष्यवाणी प्रतिगमन मॉडल की ओर ले जाती है और श्रेणीगत चर की भविष्यवाणी वर्गीकरण मॉडल की ओर ले जाती है।
वापसी
प्रतिगमन उन उदाहरणों पर विचार करता है जिनमें विशेषताएं शामिल होती हैं और जिससे, एक संख्यात्मक आउटपुट उत्पन्न होता है।
वर्गीकरण
वर्गीकरण इनपुट लेता है और एक वर्गीकृत वर्गीकरण पैदा करता है।
Note - उदाहरण डेटासेट जो सांख्यिकीय भविष्यवाणी के लिए इनपुट को परिभाषित करता है और जो मशीन को सीखने में सक्षम बनाता है, उसे "प्रशिक्षण डेटा" कहा जाता है।