OBIEE - आयामी मॉडलिंग

आयामी मॉडलिंग उन तरीकों और अवधारणाओं का सेट प्रदान करता है जो DW डिजाइन में उपयोग किए जाते हैं। डीडब्ल्यू सलाहकार, राल्फ किमबॉल के अनुसार, डेटा मॉडलिंग एक डेटा वेयरहाउस में एंड-यूज़र प्रश्नों का समर्थन करने के उद्देश्य से डेटाबेस के लिए एक डिज़ाइन तकनीक है। यह समझ और प्रदर्शन के आसपास उन्मुख है। उनके अनुसार, हालांकि लेन-देन उन्मुख ईआर लेनदेन पर कब्जा करने के लिए बहुत उपयोगी है, इसे एंड-यूज़र डिलीवरी के लिए बचा जाना चाहिए।

आयामी मॉडलिंग हमेशा तथ्यों और आयाम तालिकाओं का उपयोग करता है। तथ्य संख्यात्मक मान हैं जो तथ्य मूल्यों पर एकत्र और विश्लेषण किए जा सकते हैं। आयाम पदानुक्रम को परिभाषित करते हैं और तथ्य मूल्यों पर वर्णन करते हैं।

आयाम तालिका

आयाम तालिका उन विशेषताओं को संग्रहीत करती है जो एक तथ्य तालिका में वस्तुओं का वर्णन करती हैं। आयाम तालिका में एक प्राथमिक कुंजी होती है जो विशिष्ट रूप से प्रत्येक आयाम पंक्ति को पहचानती है। इस कुंजी का उपयोग आयाम तालिका को फैक्ट टेबल में संबद्ध करने के लिए किया जाता है।

आयाम तालिकाओं को सामान्य रूप से डी-सामान्यीकृत किया जाता है क्योंकि वे लेनदेन को निष्पादित करने के लिए नहीं बनाए गए हैं और केवल डेटा का विस्तार से विश्लेषण करने के लिए उपयोग किया जाता है।

उदाहरण

निम्नलिखित आयाम तालिका में, ग्राहक आयाम में आम तौर पर ग्राहकों का नाम, पता, ग्राहक आईडी, लिंग, आय समूह, शिक्षा स्तर आदि शामिल होते हैं।

ग्राहक आईडी, ग्राहक पहचान नाम लिंग आय शिक्षा धर्म
1 ब्रायन एज 2 3 4
2 फ्रेड स्मिथ 3 5 1
3 सैली जोन्स एफ 1 7 3

तथ्य सारणी

फैक्ट टेबल में संख्यात्मक मान होते हैं जिन्हें माप के रूप में जाना जाता है। एक फैक्ट टेबल में दो प्रकार के कॉलम होते हैं - आयाम तालिकाओं के लिए तथ्य और विदेशी कुंजी।

तथ्य तालिका में उपाय तीन प्रकार के होते हैं -

  • Additive - उपाय जो किसी भी आयाम में जोड़े जा सकते हैं।

  • Non-Additive - ऐसे उपाय जो किसी भी आयाम में नहीं जोड़े जा सकते हैं।

  • Semi-Additive - उपाय जो कुछ आयामों में जोड़े जा सकते हैं।

उदाहरण

समय आईडी उत्पाद आइ डि ग्राहक आईडी, ग्राहक पहचान यूनिट बेच दिया
4 17 2 1
8 21 3 2
8 4 1 1

इस तथ्य सारणी में समय आयाम, उत्पाद आयाम, ग्राहक आयाम और माप मूल्य इकाई के लिए विदेशी कुंजियाँ हैं।

मान लीजिए कि कोई कंपनी ग्राहकों को उत्पाद बेचती है। हर बिक्री एक तथ्य है जो कंपनी के भीतर होता है, और इन तथ्यों को रिकॉर्ड करने के लिए तथ्य तालिका का उपयोग किया जाता है।

सामान्य तथ्य हैं - यूनिट की संख्या, मार्जिन, बिक्री राजस्व, आदि आयाम तालिका सूची कारक जैसे ग्राहक, समय, उत्पाद, आदि जिसके द्वारा हम डेटा का विश्लेषण करना चाहते हैं।

अब यदि हम उपरोक्त तथ्य तालिका और ग्राहक आयाम पर विचार करते हैं तो एक उत्पाद और समय आयाम भी होगा। इस तथ्य तालिका और इन तीन आयाम तालिकाओं को देखते हुए, हम इस तरह के प्रश्न पूछ सकते हैं: 2010 में पुरुष ग्राहकों को कितनी घड़ियाँ बेची गईं?

आयाम और तथ्य तालिका के बीच अंतर

आयाम तालिकाओं और तथ्य तालिकाओं के बीच कार्यात्मक अंतर यह है कि तथ्य तालिकाओं का डेटा हम विश्लेषण करना चाहते हैं और आयाम तालिकाओं को हमें क्वेरी करने की अनुमति देने के लिए आवश्यक जानकारी रखती है।

एकत्र तालिका

एग्रीगेट टेबल में एग्रीगेटेड डेटा होता है जिसकी गणना विभिन्न एग्रीगेट कार्यों का उपयोग करके की जा सकती है।

एक aggregate function एक ऐसा कार्य है जहाँ कई पंक्तियों के मानों को एक साथ कुछ मानदंडों पर इनपुट के रूप में वर्गीकृत किया जाता है ताकि अधिक महत्वपूर्ण अर्थ या माप का एकल मान बनाया जा सके।

सामान्य कुल कार्यों में शामिल हैं -

  • Average()
  • Count()
  • Maximum()
  • Median()
  • Minimum()
  • Mode()
  • Sum()

ये समग्र तालिकाओं का उपयोग डेटा वेयरहाउस में जटिल प्रश्नों को चलाने के लिए प्रदर्शन अनुकूलन के लिए किया जाता है।

उदाहरण

आप वार्षिक (1 पंक्ति), त्रैमासिक (4 पंक्तियों), मासिक (12 पंक्तियों) जैसे एकत्रित डेटा के साथ तालिकाओं को सहेजते हैं और अब आपको डेटा की तुलना करनी होगी, जैसे वार्षिक केवल 1 पंक्ति संसाधित होगी। हालांकि एक संयुक्त तालिका में, सभी पंक्तियों को संसाधित किया जाएगा।

मिनट किसी दिए गए कॉलम में सबसे छोटा मान लौटाता है
मैक्स किसी दिए गए कॉलम में सबसे बड़ा मूल्य लौटाता है
योग किसी दिए गए कॉलम में संख्यात्मक मानों का योग देता है
औसत किसी दिए गए कॉलम का औसत मान लौटाता है
गिनती किसी दिए गए कॉलम में मानों की कुल संख्या लौटाता है
COUNT (*) किसी तालिका में पंक्तियों की संख्या लौटाता है

कर्मचारी जहां शीर्षक = 'डेवलपर' से औसत (वेतन) का चयन करें। यह कथन उन सभी कर्मचारियों का औसत वेतन लौटाएगा, जिनका शीर्षक 'डेवलपर' के बराबर है।

डेटाबेस स्तर पर एकत्रीकरण लागू किया जा सकता है। आप एग्रीगेट बना सकते हैं और उन्हें डेटाबेस में कुल तालिकाओं में सहेज सकते हैं या रिपोर्ट स्तर पर फ्लाई पर एग्रीगेट लागू कर सकते हैं।

Note - यदि आप डेटाबेस स्तर पर कुल बचत करते हैं तो यह समय बचाता है और प्रदर्शन अनुकूलन प्रदान करता है।