OBIEE - स्कीमा
स्कीमा पूरे डेटाबेस का एक तार्किक विवरण है। इसमें सभी संबंधित डेटा-आइटम और समुच्चय सहित सभी प्रकार के रिकॉर्ड का नाम और विवरण शामिल है। एक डेटाबेस की तरह, DW को भी एक स्कीमा बनाए रखने की आवश्यकता होती है। डेटाबेस रिलेशनल मॉडल का उपयोग करता है, जबकि DW स्टार, स्नोफ्लेक, और फैक्ट कांस्टेलेशन स्कीमा (गैलेक्सी स्कीमा) का उपयोग करता है।
स्टार स्कीमा
एक स्टार स्कीमा में, डी-सामान्यीकृत रूप में कई आयाम टेबल होते हैं जो केवल एक तथ्य तालिका में शामिल हो जाते हैं। विश्लेषण उद्देश्य के लिए कुछ व्यावसायिक आवश्यकता को पूरा करने के लिए इन तालिकाओं को तार्किक तरीके से जोड़ा जाता है। ये स्कीमा बहुआयामी संरचनाएं हैं जिनका उपयोग बीआई रिपोर्टिंग उपकरणों का उपयोग करके रिपोर्ट बनाने के लिए किया जाता है।
स्टार स्कीमा में आयामों में विशेषताओं का एक समूह होता है और फैक्ट टेबल में सभी आयामों और माप मूल्यों के लिए विदेशी कुंजी होती है।
उपरोक्त स्टार स्कीमा में, केंद्र में एक फैक्ट टेबल "सेल्स फैक्ट" है और प्राथमिक कुंजियों का उपयोग करके 4 आयाम तालिकाओं में शामिल किया गया है। आयाम तालिकाओं को और अधिक सामान्य नहीं किया जाता है और तालिकाओं के इस संयोजन को DW में स्टार स्कीमा के रूप में जाना जाता है।
फैक्ट टेबल में माप मान भी होते हैं - डॉलर_सोल्ड और यूनिट_सॉल्ड।
स्नोफ्लेक्स स्कीमा
स्नोफ्लेक्स स्कीमा में, सामान्यीकृत रूप में कई आयाम टेबल होते हैं जो केवल एक तथ्य तालिका में शामिल होते हैं। विश्लेषण उद्देश्य के लिए कुछ व्यावसायिक आवश्यकता को पूरा करने के लिए इन तालिकाओं को तार्किक तरीके से जोड़ा जाता है।
केवल एक स्टार और स्नोफ्लेक्स स्कीमा के बीच अंतर यह है कि आयाम तालिकाओं को और अधिक सामान्यीकृत किया जाता है। सामान्यीकरण डेटा को अतिरिक्त तालिकाओं में विभाजित करता है। स्नोफ्लेक स्कीमा में सामान्यीकरण के कारण, डेटा अतिरेक बिना किसी जानकारी को खोए कम हो जाता है और इसलिए भंडारण स्थान को बनाए रखना और सहेजना आसान हो जाता है।
स्नोफ्लेक्स स्कीमा उदाहरण के ऊपर, भंडारण स्थान को बचाने के लिए उत्पाद और ग्राहक तालिका को और सामान्य किया जाता है। कभी-कभी, यह निष्पादन अनुकूलन भी प्रदान करता है जब आप एक क्वेरी निष्पादित करते हैं जिसे सीधे सामान्यीकृत तालिका में पंक्तियों के प्रसंस्करण की आवश्यकता होती है ताकि यह प्राथमिक आयाम तालिका में पंक्तियों को संसाधित न करे और सीधे स्कीमा में सामान्यीकृत तालिका में आए।
पठन स्तर
एक तालिका में दानेदारता तालिका में संग्रहीत जानकारी के स्तर का प्रतिनिधित्व करती है। डेटा की उच्च ग्रैन्युलैरिटी का मतलब है कि डेटा लेनदेन के स्तर पर या उसके पास है, जिसमें अधिक विवरण है। कम ग्रैन्युलैरिटी का मतलब है कि डेटा में निम्न स्तर की जानकारी है।
एक तथ्य तालिका आम तौर पर कम स्तर की ग्रेन्युलैरिटी पर डिज़ाइन की जाती है। इसका मतलब यह है कि हमें जानकारी के निम्नतम स्तर को खोजने की आवश्यकता है जिसे एक तथ्य तालिका में संग्रहीत किया जा सकता है। दिनांक आयाम में, दाने का स्तर वर्ष, माह, तिमाही, अवधि, सप्ताह और दिन हो सकता है।
दानेदारता को परिभाषित करने की प्रक्रिया में दो चरण होते हैं -
- जिन आयामों को शामिल किया जाना है उनका निर्धारण करना।
- सूचना के प्रत्येक आयाम के पदानुक्रम को रखने के लिए स्थान का निर्धारण करना।
धीरे-धीरे बदलते आयाम
समय के साथ धीरे-धीरे बदलते आयाम एक विशेषता के बदलते मूल्य को संदर्भित करते हैं। यह DW में आम अवधारणाओं में से एक है।
उदाहरण
एंडी XYZ इंक का एक कर्मचारी है। वह पहली बार जुलाई 2015 में न्यूयॉर्क शहर में स्थित था। कर्मचारी लुकअप टेबल में मूल प्रविष्टि निम्नलिखित रिकॉर्ड है -
कर्मचारी कामतत्व | 10001 |
---|---|
नाम | एंडी |
स्थान | न्यूयॉर्क |
बाद की तारीख में, वह ला, कैलिफोर्निया में स्थानांतरित हो गया। इस परिवर्तन को दर्शाने के लिए XYZ Inc. को अब अपनी कर्मचारी तालिका को कैसे संशोधित करना चाहिए?
इसे "धीरे-धीरे बदलते आयाम" अवधारणा के रूप में जाना जाता है।
इस प्रकार की समस्या को हल करने के तीन तरीके हैं -
समाधान 1
नया रिकॉर्ड मूल रिकॉर्ड को बदल देता है। पुराने रिकॉर्ड का कोई निशान मौजूद नहीं है।
धीरे-धीरे बदलते आयाम, नई जानकारी बस मूल जानकारी को अधिलेखित कर देती है। दूसरे शब्दों में, कोई इतिहास नहीं रखा गया है।
कर्मचारी कामतत्व | 10001 |
---|---|
नाम | एंडी |
स्थान | ला, कैलिफोर्निया |
Benefit - स्लो चेंजिंग डायमेंशन की समस्या से निपटने का यह सबसे आसान तरीका है क्योंकि पुरानी जानकारी पर नज़र रखने की ज़रूरत नहीं है।
Disadvantage - सभी ऐतिहासिक जानकारी खो जाती है।
Use - समाधान 1 का उपयोग तब किया जाना चाहिए जब यह ऐतिहासिक जानकारी का ट्रैक रखने के लिए डीडब्ल्यू के लिए आवश्यक न हो।
समाधान २
कर्मचारी आयाम तालिका में एक नया रिकॉर्ड दर्ज किया गया है। इसलिए, कर्मचारी, एंडी को दो लोगों के रूप में माना जाता है।
नई जानकारी का प्रतिनिधित्व करने के लिए एक नया रिकॉर्ड तालिका में जोड़ा जाता है और मूल और नया रिकॉर्ड दोनों मौजूद होंगे। नए रिकॉर्ड की अपनी प्राथमिक कुंजी इस प्रकार है -
कर्मचारी कामतत्व | 10001 | 10002 |
---|---|---|
नाम | एंडी | एंडी |
स्थान | न्यूयॉर्क | ला, कैलिफोर्निया |
Benefit - यह विधि हमें सभी ऐतिहासिक जानकारी संग्रहीत करने की अनुमति देती है।
Disadvantage- तालिका का आकार तेजी से बढ़ता है। जब तालिका के लिए पंक्तियों की संख्या बहुत अधिक होती है, तो तालिका का स्थान और प्रदर्शन चिंता का विषय हो सकता है।
Use - समाधान 2 का उपयोग तब किया जाना चाहिए जब यह ऐतिहासिक डेटा रखने के लिए डीडब्ल्यू के लिए आवश्यक हो।
समाधान 3
कर्मचारी आयाम में मूल रिकॉर्ड परिवर्तन को प्रतिबिंबित करने के लिए संशोधित किया गया है।
विशेष विशेषता को इंगित करने के लिए दो कॉलम होंगे, एक मूल मूल्य इंगित करता है और दूसरा नया मूल्य इंगित करता है। एक कॉलम भी होगा जो इंगित करता है कि वर्तमान मूल्य सक्रिय हो जाता है।
कर्मचारी कामतत्व | नाम | मूल स्थान | नया स्थान | तारीख आगे बढ़ाई |
---|---|---|---|---|
10001 | एंडी | न्यूयॉर्क | ला, कैलिफोर्निया | जुलाई 2015 |
Benefits- नई जानकारी अपडेट होने के बाद से यह टेबल का आकार नहीं बढ़ाता है। इससे हम ऐतिहासिक जानकारी रख सकते हैं।
Disadvantage - यह विधि एक विशेषता से एक बार से अधिक बदल जाने पर सभी इतिहास को नहीं रखती है।
Use - समाधान 3 का उपयोग केवल तब किया जाना चाहिए जब यह ऐतिहासिक परिवर्तनों की जानकारी रखने के लिए डीडब्ल्यू के लिए आवश्यक हो।
मानकीकरण
सामान्यीकरण किसी भी जानकारी को खोए बिना तालिका को कम निरर्थक छोटे तालिकाओं में विघटित करने की प्रक्रिया है। इसलिए डेटाबेस सामान्यीकरण डेटा अतिरेक (डुप्लिकेट डेटा) को कम करने के लिए डेटाबेस की विशेषताओं और तालिकाओं को व्यवस्थित करने की प्रक्रिया है।
सामान्यीकरण का उद्देश्य
इसका उपयोग स्थिरता में सुधार के लिए कुछ प्रकार के डेटा (अतिरेक / प्रतिकृति) को समाप्त करने के लिए किया जाता है।
यह उनके सरलीकृत रूपों में ऑब्जेक्ट प्रकारों के अनुरूप तालिकाओं को रखकर भविष्य की जानकारी की जरूरतों को पूरा करने के लिए अधिकतम लचीलापन प्रदान करता है।
यह एक स्पष्ट और पठनीय डेटा मॉडल तैयार करता है।
लाभ
- डेटा अखंडता।
- डेटा संगति बढ़ाता है।
- आवश्यक डेटा अतिरेक और स्थान कम कर देता है।
- अद्यतन लागत को कम करता है।
- तदर्थ प्रश्नों के जवाब में अधिकतम लचीलापन।
- प्रति ब्लॉक पंक्तियों की कुल संख्या को कम करता है।
नुकसान
डेटाबेस में प्रश्नों का धीमा प्रदर्शन क्योंकि जुड़ने के लिए कई सामान्यीकृत तालिकाओं से प्रासंगिक डेटा प्राप्त करना होता है।
कई तालिकाओं के बीच उचित जुड़ाव करने के लिए आपको डेटा मॉडल को समझना होगा।
उदाहरण
उपरोक्त उदाहरण में, हरे ब्लॉक के अंदर तालिका लाल ब्लॉक के अंदर एक सामान्यीकृत तालिका का प्रतिनिधित्व करती है। हरे ब्लॉक में टेबल कम निरर्थक है और बिना किसी जानकारी को खोए कम पंक्तियों के साथ भी।