डेटा वेयरहाउसिंग - वितरण प्रक्रिया

एक डेटा वेयरहाउस कभी स्थिर नहीं होता है; यह व्यवसाय के विस्तार के रूप में विकसित होता है। जैसा कि व्यवसाय विकसित होता है, इसकी आवश्यकताएं बदलती रहती हैं और इसलिए इन परिवर्तनों के साथ सवारी करने के लिए एक डेटा वेयरहाउस तैयार किया जाना चाहिए। इसलिए एक डाटा वेयरहाउस सिस्टम को लचीला होना चाहिए।

आदर्श रूप से डेटा वेयरहाउस को वितरित करने के लिए एक वितरण प्रक्रिया होनी चाहिए। हालांकि डेटा वेयरहाउस परियोजनाएं आम तौर पर विभिन्न मुद्दों से ग्रस्त होती हैं जो सख्त और आदेशित फैशन में झरना विधि द्वारा मांगे जाने वाले कार्यों और वितरण को पूरा करना मुश्किल बनाती हैं। अधिकांश समय, आवश्यकताओं को पूरी तरह से समझा नहीं जाता है। सभी आवश्यकताओं को इकट्ठा करने और उनका अध्ययन करने के बाद ही आर्किटेक्चर, डिजाइन और निर्माण घटकों को पूरा किया जा सकता है।

डिलिवरी विधि

वितरण विधि डेटा वेयरहाउस की डिलीवरी के लिए अपनाए गए संयुक्त अनुप्रयोग विकास दृष्टिकोण का एक प्रकार है। हमने जोखिमों को कम करने के लिए डेटा वेयरहाउस डिलीवरी प्रक्रिया का मंचन किया है। हम यहां जिस दृष्टिकोण पर चर्चा करेंगे, वह समग्र वितरण समय-सीमा को कम नहीं करता है, लेकिन यह सुनिश्चित करता है कि व्यावसायिक लाभ विकास प्रक्रिया के माध्यम से वृद्धिशील रूप से वितरित किए जाते हैं।

Note - परियोजना और वितरण जोखिम को कम करने के लिए वितरण प्रक्रिया को चरणों में तोड़ा जाता है।

निम्नलिखित चित्र वितरण प्रक्रिया के चरणों को बताते हैं -

आईटी रणनीति

डेटा वेयरहाउस वे रणनीतिक निवेश हैं जो लाभ उत्पन्न करने के लिए एक व्यावसायिक प्रक्रिया की आवश्यकता है। परियोजना के लिए धन प्राप्त करने और उसे बनाए रखने के लिए आईटी रणनीति की आवश्यकता होती है।

व्यापार का मामला

व्यवसाय के मामले का उद्देश्य व्यावसायिक लाभों का अनुमान लगाना है जो डेटा वेयरहाउस का उपयोग करने से प्राप्त किया जाना चाहिए। इन लाभों को मात्रात्मक नहीं किया जा सकता है, लेकिन अनुमानित लाभ स्पष्ट रूप से कहा जाना चाहिए। यदि किसी डेटा वेयरहाउस में कोई स्पष्ट व्यावसायिक मामला नहीं है, तो व्यवसाय डिलीवरी की प्रक्रिया के दौरान कुछ स्तर पर विश्वसनीयता की समस्याओं से ग्रस्त है। इसलिए डेटा गोदाम परियोजनाओं में, हमें निवेश के लिए व्यापार के मामले को समझने की आवश्यकता है।

शिक्षा और प्रोटोटाइप

संगठन डेटा विश्लेषण की अवधारणा के साथ प्रयोग करते हैं और समाधान के लिए बसने से पहले डेटा वेयरहाउस होने के मूल्य पर खुद को शिक्षित करते हैं। इसे प्रोटोटाइप द्वारा संबोधित किया गया है। यह डेटा वेयरहाउस की व्यवहार्यता और लाभों को समझने में मदद करता है। छोटे पैमाने पर प्रोटोटाइप गतिविधि लंबे समय तक शैक्षिक प्रक्रिया को बढ़ावा दे सकती है -

  • प्रोटोटाइप एक परिभाषित तकनीकी उद्देश्य को संबोधित करता है।

  • व्यवहार्यता अवधारणा दिखाए जाने के बाद प्रोटोटाइप को फेंक दिया जा सकता है।

  • गतिविधि डेटा वेयरहाउस की अंतिम डेटा सामग्री का एक छोटा सबसेट को संबोधित करती है।

  • गतिविधि की समय-सीमा गैर-महत्वपूर्ण है।

प्रारंभिक रिलीज का उत्पादन करने और व्यावसायिक लाभ देने के लिए निम्नलिखित बिंदुओं को ध्यान में रखा जाना चाहिए।

  • उस वास्तुकला को पहचानें जो विकसित करने में सक्षम है।

  • व्यावसायिक आवश्यकताओं और तकनीकी खाका चरणों पर ध्यान दें।

  • पहले बिल्ड चरण के दायरे को न्यूनतम तक सीमित करें जो व्यावसायिक लाभ प्रदान करता है।

  • डेटा वेयरहाउस की अल्पकालिक और मध्यम अवधि की आवश्यकताओं को समझें।

व्यापार की आवश्यकताओं

गुणवत्ता प्रदान करने के लिए, हमें यह सुनिश्चित करना चाहिए कि समग्र आवश्यकताओं को समझा जाए। यदि हम अल्पकालिक और मध्यम अवधि दोनों के लिए व्यावसायिक आवश्यकताओं को समझते हैं, तो हम अल्पकालिक आवश्यकताओं को पूरा करने के लिए एक समाधान डिज़ाइन कर सकते हैं। अल्पकालिक समाधान तो एक पूर्ण समाधान के लिए उगाया जा सकता है।

इस चरण में निम्नलिखित पहलुओं का निर्धारण किया गया है -

  • डेटा पर लागू होने वाला व्यावसायिक नियम।

  • डेटा वेयरहाउस के भीतर जानकारी के लिए तार्किक मॉडल।

  • तत्काल आवश्यकता के लिए क्वेरी प्रोफ़ाइल।

  • स्रोत सिस्टम जो यह डेटा प्रदान करते हैं।

तकनीकी खाका

इस चरण में दीर्घकालिक आवश्यकताओं को पूरा करते हुए एक समग्र वास्तुकला देने की आवश्यकता है। यह चरण उन घटकों को भी वितरित करता है जिन्हें किसी भी व्यावसायिक लाभ को प्राप्त करने के लिए अल्पावधि में लागू किया जाना चाहिए। ब्लूप्रिंट का अनुसरण करने की आवश्यकता है।

  • समग्र प्रणाली वास्तुकला।
  • डेटा अवधारण नीति।
  • बैकअप और रिकवरी रणनीति।
  • सर्वर और डेटा मार्ट आर्किटेक्चर।
  • हार्डवेयर और बुनियादी ढांचे के लिए क्षमता योजना।
  • डेटाबेस डिजाइन के घटक।

संस्करण का निर्माण

इस चरण में, पहला उत्पादन सुपुर्द किया जाता है। यह उत्पादन करने योग्य डेटा वेयरहाउस का सबसे छोटा घटक है। यह सबसे छोटा घटक व्यावसायिक लाभ जोड़ता है।

इतिहास का भार

यह वह चरण है जहां आवश्यक इतिहास के शेष हिस्से को डेटा वेयरहाउस में लोड किया जाता है। इस चरण में, हम नई इकाइयां नहीं जोड़ते हैं, लेकिन अतिरिक्त भौतिक तालिकाओं को संभवतः बढ़े हुए डेटा संस्करणों को संग्रहीत करने के लिए बनाया जाएगा।

एक उदाहरण लेते हैं। मान लीजिए कि बिल्ड वर्जन के चरण ने 2 महीने के इतिहास के साथ एक खुदरा बिक्री विश्लेषण डेटा गोदाम दिया है। यह जानकारी उपयोगकर्ता को केवल हाल के रुझानों का विश्लेषण करने और अल्पकालिक मुद्दों को संबोधित करने की अनुमति देगा। इस मामले में उपयोगकर्ता वार्षिक और मौसमी रुझानों की पहचान नहीं कर सकता है। उसे ऐसा करने में मदद करने के लिए, पिछले 2 साल की बिक्री का इतिहास संग्रह से लोड किया जा सकता है। अब 40GB डेटा 400GB तक बढ़ा दिया गया है।

Note - बैकअप और पुनर्प्राप्ति प्रक्रिया जटिल हो सकती है, इसलिए इस गतिविधि को एक अलग चरण में करने की सिफारिश की जाती है।

तदर्थ क्वेरी

इस चरण में, हम एक तदर्थ क्वेरी उपकरण को कॉन्फ़िगर करते हैं जिसका उपयोग डेटा वेयरहाउस को संचालित करने के लिए किया जाता है। ये उपकरण डेटाबेस क्वेरी उत्पन्न कर सकते हैं।

Note - यह अनुशंसा की जाती है कि जब डेटाबेस को पर्याप्त रूप से संशोधित किया जा रहा हो तो इन एक्सेस टूल का उपयोग न करें।

स्वचालन

इस चरण में, परिचालन प्रबंधन प्रक्रियाएं पूरी तरह से स्वचालित हैं। इनमें शामिल होंगे -

  • विश्लेषण के लिए उपयुक्त रूप में डेटा को बदलना।

  • क्वेरी प्रोफाइल की निगरानी करना और सिस्टम प्रदर्शन को बनाए रखने के लिए उपयुक्त एकत्रीकरण का निर्धारण करना।

  • विभिन्न स्रोत प्रणालियों से डेटा निकालना और लोड करना।

  • डेटा वेयरहाउस के भीतर पूर्वनिर्धारित परिभाषाओं से एकत्रीकरण उत्पन्न करना।

  • डेटा का बैकअप लेना, पुनर्स्थापित करना और संग्रहीत करना।

विस्तार करना

इस चरण में, व्यावसायिक आवश्यकताओं के एक नए सेट को संबोधित करने के लिए डेटा वेयरहाउस को विस्तारित किया जाता है। दायरा दो तरीकों से बढ़ाया जा सकता है -

  • डेटा वेयरहाउस में अतिरिक्त डेटा लोड करके।

  • मौजूदा जानकारी का उपयोग करके नए डेटा मौतों की शुरुआत करके।

Note - इस चरण को अलग से प्रदर्शन किया जाना चाहिए, क्योंकि इसमें पर्याप्त प्रयास और जटिलता शामिल है।

आवश्यकताएँ विकास

वितरण प्रक्रिया के दृष्टिकोण से, आवश्यकताएँ हमेशा परिवर्तनशील होती हैं। वे स्थिर नहीं हैं। वितरण प्रक्रिया को इसका समर्थन करना चाहिए और इन परिवर्तनों को सिस्टम के भीतर परिलक्षित करना चाहिए।

यह समस्या मौजूदा प्रक्रियाओं के डेटा आवश्यकताओं के विपरीत, व्यावसायिक प्रक्रियाओं के भीतर डेटा के उपयोग के आसपास डेटा वेयरहाउस को डिज़ाइन करके संबोधित की जाती है।

वास्तुकला को व्यवसाय की जरूरतों से मेल खाने के लिए बदलने और विकसित करने के लिए डिज़ाइन किया गया है, यह प्रक्रिया एक छद्म-अनुप्रयोग विकास प्रक्रिया के रूप में संचालित होती है, जहां नई आवश्यकताओं को लगातार विकास गतिविधियों में खिलाया जाता है और आंशिक वितरण का उत्पादन किया जाता है। इन आंशिक डिलिवरेबल्स को वापस उपयोगकर्ताओं को खिलाया जाता है और फिर यह सुनिश्चित किया जाता है कि व्यावसायिक जरूरतों को पूरा करने के लिए समग्र प्रणाली को लगातार अपडेट किया जाए।