डेटा वेयरहाउसिंग - अवधारणाओं
डेटा वेयरहाउसिंग क्या है?
डेटा वेयरहाउसिंग डेटा वेयरहाउस के निर्माण और उपयोग की प्रक्रिया है। एक डेटा वेयरहाउस का निर्माण कई विषम स्रोतों से डेटा को एकीकृत करके किया जाता है जो विश्लेषणात्मक रिपोर्टिंग, संरचित और / या तदर्थ प्रश्नों और निर्णय लेने का समर्थन करते हैं। डेटा वेयरहाउसिंग में डेटा सफाई, डेटा एकीकरण और डेटा समेकन शामिल हैं।
डेटा वेयरहाउस जानकारी का उपयोग करना
निर्णय समर्थन तकनीकें हैं जो डेटा वेयरहाउस में उपलब्ध डेटा का उपयोग करने में मदद करती हैं। ये प्रौद्योगिकियां अधिकारियों को गोदाम का उपयोग जल्दी और प्रभावी ढंग से करने में मदद करती हैं। वे डेटा इकट्ठा कर सकते हैं, इसका विश्लेषण कर सकते हैं, और गोदाम में मौजूद जानकारी के आधार पर निर्णय ले सकते हैं। एक गोदाम में एकत्रित जानकारी का उपयोग निम्नलिखित में से किसी भी डोमेन में किया जा सकता है -
Tuning Production Strategies - उत्पाद की रणनीतियों को अच्छी तरह से तैयार करके उत्पादों को पुन: व्यवस्थित किया जा सकता है और बिक्री या तिमाही की तुलना करके उत्पाद पोर्टफोलियो का प्रबंधन किया जा सकता है।
Customer Analysis - ग्राहक की पसंद, समय की खरीद, बजट चक्र, आदि का विश्लेषण करके ग्राहक का विश्लेषण किया जाता है।
Operations Analysis- डेटा वेयरहाउसिंग ग्राहक संबंध प्रबंधन और पर्यावरणीय सुधार करने में भी मदद करता है। जानकारी हमें व्यावसायिक कार्यों का विश्लेषण करने की भी अनुमति देती है।
विषम डेटाबेस
विषम डेटाबेस को एकीकृत करने के लिए, हमारे पास दो दृष्टिकोण हैं -
- क्वेरी चालित दृष्टिकोण
- अद्यतन-संचालित दृष्टिकोण
प्रश्न-चालित दृष्टिकोण
यह विषम डेटाबेस को एकीकृत करने के लिए पारंपरिक दृष्टिकोण है। इस दृष्टिकोण का उपयोग कई विषम डेटाबेस के शीर्ष पर रैपर और इंटीग्रेटर्स के निर्माण के लिए किया गया था। इन इंटीग्रेटर्स को मध्यस्थों के रूप में भी जाना जाता है।
क्वेरी-चालित दृष्टिकोण की प्रक्रिया
जब कोई क्वेरी क्लाइंट पक्ष को जारी की जाती है, तो मेटाडेटा शब्दकोश क्वेरी को अलग-अलग विषम साइटों के लिए उपयुक्त रूप में अनुवादित करता है।
अब इन क्वेरी को मैप किया जाता है और स्थानीय क्वेरी प्रोसेसर को भेजा जाता है।
विषम स्थलों से परिणाम एक वैश्विक उत्तर सेट में एकीकृत होते हैं।
नुकसान
क्वेरी-चालित दृष्टिकोण को जटिल एकीकरण और फ़िल्टरिंग प्रक्रियाओं की आवश्यकता होती है।
यह दृष्टिकोण बहुत ही अक्षम है।
यह लगातार प्रश्नों के लिए बहुत महंगा है।
एकत्रीकरण की आवश्यकता वाले प्रश्नों के लिए यह दृष्टिकोण बहुत महंगा है।
अद्यतन-प्रेरित दृष्टिकोण
यह पारंपरिक दृष्टिकोण का एक विकल्प है। आज के डेटा वेयरहाउस सिस्टम पहले से चर्चा किए गए पारंपरिक दृष्टिकोण के बजाय अपडेट-संचालित दृष्टिकोण का पालन करते हैं। अपडेट-संचालित दृष्टिकोण में, कई विषम स्रोतों से जानकारी अग्रिम में एकीकृत की जाती है और एक गोदाम में संग्रहीत की जाती है। यह जानकारी प्रत्यक्ष क्वेरी और विश्लेषण के लिए उपलब्ध है।
लाभ
इस दृष्टिकोण के निम्नलिखित फायदे हैं -
यह दृष्टिकोण उच्च प्रदर्शन प्रदान करता है।
डेटा को पहले से ही अर्थ डेटा स्टोर में कॉपी, संसाधित, एकीकृत, एनोटेट, संक्षेप और पुनर्गठन किया जाता है।
क्वेरी संसाधन को स्थानीय स्रोतों पर डेटा संसाधित करने के लिए इंटरफ़ेस की आवश्यकता नहीं होती है।
डेटा वेयरहाउस टूल्स और यूटिलिटीज के कार्य
डेटा वेयरहाउस टूल और उपयोगिताओं के कार्य निम्नलिखित हैं -
Data Extraction - कई विषम स्रोतों से डेटा एकत्र करना।
Data Cleaning - डेटा में त्रुटियों को खोजने और सही करने के लिए आमंत्रित करता है।
Data Transformation - डेटा को विरासत फॉर्मेट से वेयरहाउस फॉर्मेट में कनवर्ट करना।
Data Loading - छँटाई, संक्षेपण, समेकन, जाँच अखंडता, और सूचकांकों और विभाजन के निर्माण में शामिल हैं।
Refreshing - डेटा स्रोतों से गोदाम तक अद्यतन करने का आह्वान किया।
Note - डेटा की गुणवत्ता और डेटा माइनिंग परिणामों को बेहतर बनाने के लिए डेटा क्लीनिंग और डेटा ट्रांसफ़ॉर्मेशन महत्वपूर्ण कदम हैं।