डेटा वेयरहाउसिंग - डेटा मार्टिंग

हमें डेटा मार्ट की आवश्यकता क्यों है?

डेटा मार्ट बनाने के लिए नीचे सूचीबद्ध कारण हैं -

  • थोपने के लिए डेटा का विभाजन करना access control strategies.

  • स्कैन किए जाने वाले डेटा की मात्रा को कम करके प्रश्नों को गति देने के लिए।

  • विभिन्न हार्डवेयर प्लेटफार्मों में डेटा को विभाजित करने के लिए।

  • उपयोगकर्ता एक्सेस टूल के लिए उपयुक्त रूप में डेटा की संरचना करने के लिए।

Note- किसी अन्य कारण से डेटा मार्ट न करें क्योंकि डेटा मार्टिंग की संचालन लागत बहुत अधिक हो सकती है। डेटा मार्टिंग से पहले, सुनिश्चित करें कि डेटा मार्टिंग रणनीति आपके विशेष समाधान के लिए उपयुक्त है।

लागत प्रभावी डेटा मार्टिंग

डेटा मार्टिंग को प्रभावी बनाने के लिए नीचे दिए गए चरणों का पालन करें -

  • कार्यात्मक विभाजन को पहचानें
  • उपयोगकर्ता एक्सेस टूल आवश्यकताएँ पहचानें
  • अभिगम नियंत्रण मुद्दों की पहचान करें

कार्यात्मक विभाजन को पहचानें

इस चरण में, हम निर्धारित करते हैं कि संगठन में प्राकृतिक कार्यात्मक विभाजन हैं या नहीं। हम विभागीय विभाजन की तलाश करते हैं, और हम यह निर्धारित करते हैं कि क्या जिस तरह से विभाग जानकारी का उपयोग करते हैं वह संगठन के बाकी हिस्सों से अलग-थलग है। चलो एक उदाहरण है।

एक खुदरा संगठन पर विचार करें, जहां प्रत्येक व्यापारी उत्पादों के समूह की बिक्री को अधिकतम करने के लिए जवाबदेह है। इसके लिए, निम्नलिखित बहुमूल्य जानकारी हैं -

  • दैनिक आधार पर बिक्री लेनदेन
  • साप्ताहिक आधार पर बिक्री का पूर्वानुमान
  • दैनिक आधार पर स्टॉक की स्थिति
  • एक दैनिक आधार पर स्टॉक आंदोलनों

जैसा कि व्यापारी उन उत्पादों में दिलचस्पी नहीं रखते हैं, जिनके साथ वे काम नहीं कर रहे हैं, डेटा मार्टिंग डेटा डीलिंग का सबसेट है, जो उत्पाद समूह का हित है। निम्नलिखित आरेख विभिन्न उपयोगकर्ताओं के लिए डेटा मार्टिंग दिखाता है।

नीचे दिए गए मुद्दों को कार्यात्मक विभाजन का निर्धारण करते समय ध्यान में रखा जाना चाहिए -

  • विभाग की संरचना बदल सकती है।

  • उत्पाद एक विभाग से दूसरे विभाग में जा सकते हैं।

  • व्यापारी बिक्री के लिए क्या कर रहा है, इसका विश्लेषण करने के लिए अन्य उत्पादों की बिक्री की प्रवृत्ति को क्वेरी कर सकता है।

Note - हमें व्यावसायिक लाभ और डेटा मार्ट का उपयोग करने की तकनीकी व्यवहार्यता निर्धारित करने की आवश्यकता है।

उपयोगकर्ता एक्सेस टूल आवश्यकताएँ पहचानें

हमें समर्थन करने के लिए डेटा मौसा की आवश्यकता है user access toolsआंतरिक डेटा संरचनाओं की आवश्यकता होती है। ऐसी संरचनाओं में डेटा डेटा वेयरहाउस के नियंत्रण से बाहर हैं, लेकिन उन्हें नियमित आधार पर आबादी और अद्यतन करने की आवश्यकता है।

कुछ उपकरण हैं जो सीधे स्रोत प्रणाली से आबाद होते हैं लेकिन कुछ नहीं कर सकते। इसलिए उपकरण के दायरे से बाहर की अतिरिक्त आवश्यकताओं को भविष्य के लिए पहचानने की आवश्यकता होती है।

Note - सभी एक्सेस टूल्स में डेटा की निरंतरता सुनिश्चित करने के लिए, डेटा को सीधे डेटा वेयरहाउस से पॉप्युलेट नहीं किया जाना चाहिए, बल्कि प्रत्येक टूल का अपना डेटा मार्ट होना चाहिए।

अभिगम नियंत्रण मुद्दों की पहचान करें

केवल अधिकृत उपयोगकर्ताओं द्वारा डेटा तक पहुँचने के लिए गोपनीयता नियम होना चाहिए। उदाहरण के लिए खुदरा बैंकिंग संस्थान के लिए एक डेटा वेयरहाउस सुनिश्चित करता है कि सभी खाते एक ही कानूनी इकाई के हैं। गोपनीयता कानून आपको ऐसी जानकारी तक पहुंचने से रोकने के लिए बाध्य कर सकते हैं जो विशिष्ट बैंक के स्वामित्व में नहीं है।

डेटा मौसा हमें डेटा वेयरहाउस के भीतर डेटा सेगमेंट को शारीरिक रूप से अलग करके एक पूर्ण दीवार बनाने की अनुमति देते हैं। संभावित गोपनीयता समस्याओं से बचने के लिए, विस्तृत डेटा को डेटा वेयरहाउस से हटाया जा सकता है। हम प्रत्येक कानूनी इकाई के लिए डेटा मार्ट बना सकते हैं और इसे विस्तृत खाते के डेटा के साथ डेटा वेयरहाउस के माध्यम से लोड कर सकते हैं।

डेटा मार्ट डिजाइन करना

डेटा माल को डेटा वेयरहाउस के भीतर स्टारफ्लेक स्कीमा के छोटे संस्करण के रूप में डिज़ाइन किया जाना चाहिए और डेटा वेयरहाउस के डेटाबेस डिज़ाइन के साथ मेल खाना चाहिए। यह डेटाबेस इंस्टेंस पर नियंत्रण बनाए रखने में मदद करता है।

सारांश डेटा को उसी तरह से मार्ट किया जाता है जैसे वे डेटा वेयरहाउस के भीतर डिज़ाइन किया गया होगा। सारांश तालिकाएँ स्टारफ्लेक स्कीमा में सभी आयाम डेटा का उपयोग करने में मदद करती हैं।

डाटा मार्टिंग की लागत

डेटा मार्टिंग के लिए लागत उपाय इस प्रकार हैं -

  • हार्डवेयर और सॉफ्टवेयर लागत
  • नेटवर्क का उपयोग
  • समय खिड़की की कमी

हार्डवेयर और सॉफ्टवेयर लागत

हालांकि डेटा मौसा एक ही हार्डवेयर पर बनाए जाते हैं, उन्हें कुछ अतिरिक्त हार्डवेयर और सॉफ़्टवेयर की आवश्यकता होती है। उपयोगकर्ता प्रश्नों को संभालने के लिए, इसे अतिरिक्त प्रसंस्करण शक्ति और डिस्क भंडारण की आवश्यकता होती है। यदि विस्तृत डेटा और डेटा मार्ट डेटा वेयरहाउस के भीतर मौजूद है, तो हम प्रतिकृति डेटा को संग्रहीत और प्रबंधित करने के लिए अतिरिक्त लागत का सामना करेंगे।

Note - डेटा मार्टिंग एकत्रीकरण की तुलना में अधिक महंगा है, इसलिए इसे एक अतिरिक्त रणनीति के रूप में उपयोग किया जाना चाहिए और वैकल्पिक रणनीति के रूप में नहीं।

नेटवर्क का उपयोग

डेटा वेयरहाउस से डेटा मार्ट एक अलग स्थान पर हो सकता है, इसलिए हमें यह सुनिश्चित करना चाहिए कि LAN या WAN डेटा वॉल्यूम को हैंडल करने की क्षमता रखता है जिसे भीतर स्थानांतरित किया जा रहा है data mart load process.

समय खिड़की की कमी

उपलब्ध समय विंडो में डेटा मार्ट लोडिंग प्रक्रिया कितनी हद तक खाएगी, यह ट्रांसफॉर्मेशन की जटिलता और डेटा वॉल्यूम को शिप किए जाने पर निर्भर करता है। कितने डेटा मौसा संभव है का निर्धारण इस पर निर्भर करता है -

  • नेटवर्क की क्षमता।
  • समय खिड़की उपलब्ध है
  • स्थानांतरित किया जा रहा डेटा की मात्रा
  • डेटा मार्ट में डेटा डालने के लिए इस्तेमाल किया जा रहा है