OBIEE - स्कीमा

स्कीमा पूरे डेटाबेस का एक तार्किक विवरण है। इसमें सभी संबंधित डेटा-आइटम और समुच्चय सहित सभी प्रकार के रिकॉर्ड का नाम और विवरण शामिल है। एक डेटाबेस की तरह, DW को भी एक स्कीमा बनाए रखने की आवश्यकता होती है। डेटाबेस रिलेशनल मॉडल का उपयोग करता है, जबकि DW स्टार, स्नोफ्लेक, और फैक्ट कांस्टेलेशन स्कीमा (गैलेक्सी स्कीमा) का उपयोग करता है।

स्टार स्कीमा

एक स्टार स्कीमा में, डी-सामान्यीकृत रूप में कई आयाम टेबल होते हैं जो केवल एक तथ्य तालिका में शामिल हो जाते हैं। विश्लेषण उद्देश्य के लिए कुछ व्यावसायिक आवश्यकता को पूरा करने के लिए इन तालिकाओं को तार्किक तरीके से जोड़ा जाता है। ये स्कीमा बहुआयामी संरचनाएं हैं जिनका उपयोग बीआई रिपोर्टिंग उपकरणों का उपयोग करके रिपोर्ट बनाने के लिए किया जाता है।

स्टार स्कीमा में आयामों में विशेषताओं का एक समूह होता है और फैक्ट टेबल में सभी आयामों और माप मूल्यों के लिए विदेशी कुंजी होती है।

उपरोक्त स्टार स्कीमा में, केंद्र में एक फैक्ट टेबल "सेल्स फैक्ट" है और प्राथमिक कुंजियों का उपयोग करके 4 आयाम तालिकाओं में शामिल किया गया है। आयाम तालिकाओं को और अधिक सामान्य नहीं किया जाता है और तालिकाओं के इस संयोजन को DW में स्टार स्कीमा के रूप में जाना जाता है।

फैक्ट टेबल में माप मान भी होते हैं - डॉलर_सोल्ड और यूनिट_सॉल्ड।

स्नोफ्लेक्स स्कीमा

स्नोफ्लेक्स स्कीमा में, सामान्यीकृत रूप में कई आयाम टेबल होते हैं जो केवल एक तथ्य तालिका में शामिल होते हैं। विश्लेषण उद्देश्य के लिए कुछ व्यावसायिक आवश्यकता को पूरा करने के लिए इन तालिकाओं को तार्किक तरीके से जोड़ा जाता है।

केवल एक स्टार और स्नोफ्लेक्स स्कीमा के बीच अंतर यह है कि आयाम तालिकाओं को और अधिक सामान्यीकृत किया जाता है। सामान्यीकरण डेटा को अतिरिक्त तालिकाओं में विभाजित करता है। स्नोफ्लेक स्कीमा में सामान्यीकरण के कारण, डेटा अतिरेक बिना किसी जानकारी को खोए कम हो जाता है और इसलिए भंडारण स्थान को बनाए रखना और सहेजना आसान हो जाता है।

स्नोफ्लेक्स स्कीमा उदाहरण के ऊपर, भंडारण स्थान को बचाने के लिए उत्पाद और ग्राहक तालिका को और सामान्य किया जाता है। कभी-कभी, यह निष्पादन अनुकूलन भी प्रदान करता है जब आप एक क्वेरी निष्पादित करते हैं जिसे सीधे सामान्यीकृत तालिका में पंक्तियों के प्रसंस्करण की आवश्यकता होती है ताकि यह प्राथमिक आयाम तालिका में पंक्तियों को संसाधित न करे और सीधे स्कीमा में सामान्यीकृत तालिका में आए।

पठन स्तर

एक तालिका में दानेदारता तालिका में संग्रहीत जानकारी के स्तर का प्रतिनिधित्व करती है। डेटा की उच्च ग्रैन्युलैरिटी का मतलब है कि डेटा लेनदेन के स्तर पर या उसके पास है, जिसमें अधिक विवरण है। कम ग्रैन्युलैरिटी का मतलब है कि डेटा में निम्न स्तर की जानकारी है।

एक तथ्य तालिका आम तौर पर कम स्तर की ग्रेन्युलैरिटी पर डिज़ाइन की जाती है। इसका मतलब यह है कि हमें जानकारी के निम्नतम स्तर को खोजने की आवश्यकता है जिसे एक तथ्य तालिका में संग्रहीत किया जा सकता है। दिनांक आयाम में, दाने का स्तर वर्ष, माह, तिमाही, अवधि, सप्ताह और दिन हो सकता है।

दानेदारता को परिभाषित करने की प्रक्रिया में दो चरण होते हैं -

  • जिन आयामों को शामिल किया जाना है उनका निर्धारण करना।
  • सूचना के प्रत्येक आयाम के पदानुक्रम को रखने के लिए स्थान का निर्धारण करना।

धीरे-धीरे बदलते आयाम

समय के साथ धीरे-धीरे बदलते आयाम एक विशेषता के बदलते मूल्य को संदर्भित करते हैं। यह DW में आम अवधारणाओं में से एक है।

उदाहरण

एंडी XYZ इंक का एक कर्मचारी है। वह पहली बार जुलाई 2015 में न्यूयॉर्क शहर में स्थित था। कर्मचारी लुकअप टेबल में मूल प्रविष्टि निम्नलिखित रिकॉर्ड है -

कर्मचारी कामतत्व 10001
नाम एंडी
स्थान न्यूयॉर्क

बाद की तारीख में, वह ला, कैलिफोर्निया में स्थानांतरित हो गया। इस परिवर्तन को दर्शाने के लिए XYZ Inc. को अब अपनी कर्मचारी तालिका को कैसे संशोधित करना चाहिए?

इसे "धीरे-धीरे बदलते आयाम" अवधारणा के रूप में जाना जाता है।

इस प्रकार की समस्या को हल करने के तीन तरीके हैं -

समाधान 1

नया रिकॉर्ड मूल रिकॉर्ड को बदल देता है। पुराने रिकॉर्ड का कोई निशान मौजूद नहीं है।

धीरे-धीरे बदलते आयाम, नई जानकारी बस मूल जानकारी को अधिलेखित कर देती है। दूसरे शब्दों में, कोई इतिहास नहीं रखा गया है।

कर्मचारी कामतत्व 10001
नाम एंडी
स्थान ला, कैलिफोर्निया
  • Benefit - स्लो चेंजिंग डायमेंशन की समस्या से निपटने का यह सबसे आसान तरीका है क्योंकि पुरानी जानकारी पर नज़र रखने की ज़रूरत नहीं है।

  • Disadvantage - सभी ऐतिहासिक जानकारी खो जाती है।

  • Use - समाधान 1 का उपयोग तब किया जाना चाहिए जब यह ऐतिहासिक जानकारी का ट्रैक रखने के लिए डीडब्ल्यू के लिए आवश्यक न हो।

समाधान २

कर्मचारी आयाम तालिका में एक नया रिकॉर्ड दर्ज किया गया है। इसलिए, कर्मचारी, एंडी को दो लोगों के रूप में माना जाता है।

नई जानकारी का प्रतिनिधित्व करने के लिए एक नया रिकॉर्ड तालिका में जोड़ा जाता है और मूल और नया रिकॉर्ड दोनों मौजूद होंगे। नए रिकॉर्ड की अपनी प्राथमिक कुंजी इस प्रकार है -

कर्मचारी कामतत्व 10001 10002
नाम एंडी एंडी
स्थान न्यूयॉर्क ला, कैलिफोर्निया
  • Benefit - यह विधि हमें सभी ऐतिहासिक जानकारी संग्रहीत करने की अनुमति देती है।

  • Disadvantage- तालिका का आकार तेजी से बढ़ता है। जब तालिका के लिए पंक्तियों की संख्या बहुत अधिक होती है, तो तालिका का स्थान और प्रदर्शन चिंता का विषय हो सकता है।

  • Use - समाधान 2 का उपयोग तब किया जाना चाहिए जब यह ऐतिहासिक डेटा रखने के लिए डीडब्ल्यू के लिए आवश्यक हो।

समाधान 3

कर्मचारी आयाम में मूल रिकॉर्ड परिवर्तन को प्रतिबिंबित करने के लिए संशोधित किया गया है।

विशेष विशेषता को इंगित करने के लिए दो कॉलम होंगे, एक मूल मूल्य इंगित करता है और दूसरा नया मूल्य इंगित करता है। एक कॉलम भी होगा जो इंगित करता है कि वर्तमान मूल्य सक्रिय हो जाता है।

कर्मचारी कामतत्व नाम मूल स्थान नया स्थान तारीख आगे बढ़ाई
10001 एंडी न्यूयॉर्क ला, कैलिफोर्निया जुलाई 2015
  • Benefits- नई जानकारी अपडेट होने के बाद से यह टेबल का आकार नहीं बढ़ाता है। इससे हम ऐतिहासिक जानकारी रख सकते हैं।

  • Disadvantage - यह विधि एक विशेषता से एक बार से अधिक बदल जाने पर सभी इतिहास को नहीं रखती है।

  • Use - समाधान 3 का उपयोग केवल तब किया जाना चाहिए जब यह ऐतिहासिक परिवर्तनों की जानकारी रखने के लिए डीडब्ल्यू के लिए आवश्यक हो।

मानकीकरण

सामान्यीकरण किसी भी जानकारी को खोए बिना तालिका को कम निरर्थक छोटे तालिकाओं में विघटित करने की प्रक्रिया है। इसलिए डेटाबेस सामान्यीकरण डेटा अतिरेक (डुप्लिकेट डेटा) को कम करने के लिए डेटाबेस की विशेषताओं और तालिकाओं को व्यवस्थित करने की प्रक्रिया है।

सामान्यीकरण का उद्देश्य

  • इसका उपयोग स्थिरता में सुधार के लिए कुछ प्रकार के डेटा (अतिरेक / प्रतिकृति) को समाप्त करने के लिए किया जाता है।

  • यह उनके सरलीकृत रूपों में ऑब्जेक्ट प्रकारों के अनुरूप तालिकाओं को रखकर भविष्य की जानकारी की जरूरतों को पूरा करने के लिए अधिकतम लचीलापन प्रदान करता है।

  • यह एक स्पष्ट और पठनीय डेटा मॉडल तैयार करता है।

लाभ

  • डेटा अखंडता।
  • डेटा संगति बढ़ाता है।
  • आवश्यक डेटा अतिरेक और स्थान कम कर देता है।
  • अद्यतन लागत को कम करता है।
  • तदर्थ प्रश्नों के जवाब में अधिकतम लचीलापन।
  • प्रति ब्लॉक पंक्तियों की कुल संख्या को कम करता है।

नुकसान

डेटाबेस में प्रश्नों का धीमा प्रदर्शन क्योंकि जुड़ने के लिए कई सामान्यीकृत तालिकाओं से प्रासंगिक डेटा प्राप्त करना होता है।

कई तालिकाओं के बीच उचित जुड़ाव करने के लिए आपको डेटा मॉडल को समझना होगा।

उदाहरण

उपरोक्त उदाहरण में, हरे ब्लॉक के अंदर तालिका लाल ब्लॉक के अंदर एक सामान्यीकृत तालिका का प्रतिनिधित्व करती है। हरे ब्लॉक में टेबल कम निरर्थक है और बिना किसी जानकारी को खोए कम पंक्तियों के साथ भी।