डेटा वेयरहाउसिंग - OLAP

ऑनलाइन एनालिटिकल प्रोसेसिंग सर्वर (OLAP) बहुआयामी डेटा मॉडल पर आधारित है। यह प्रबंधकों, और विश्लेषकों को सूचना के तेज़, सुसंगत, और संवादात्मक पहुँच के माध्यम से जानकारी की अंतर्दृष्टि प्राप्त करने की अनुमति देता है। यह अध्याय OLAP के प्रकार, OLAP पर संचालन, OLAP और सांख्यिकीय डेटाबेस और OLTP के बीच अंतर को कवर करता है।

OLAP सर्वर के प्रकार

हमारे पास चार प्रकार के OLAP सर्वर हैं -

  • संबंधपरक OLAP (रोलअप)
  • बहुआयामी OLAP (MOLAP)
  • हाइब्रिड OLAP (HOLAP)
  • विशिष्ट SQL सर्वर

संबंधपरक OLAP

रोलैप सर्वरों को रिलेशनल बैक-एंड सर्वर और क्लाइंट फ्रंट-एंड टूल्स के बीच रखा गया है। वेयरहाउस डेटा को स्टोर और प्रबंधित करने के लिए, ROLAP रिलेशनल या विस्तारित-रिलेशनल डीबीएमएस का उपयोग करता है।

रोल में निम्नलिखित शामिल हैं -

  • एकत्रीकरण नेविगेशन तर्क का कार्यान्वयन।
  • प्रत्येक DBMS बैक एंड के लिए ऑप्टिमाइज़ेशन।
  • अतिरिक्त उपकरण और सेवाएँ।

बहुआयामी OLAP

MOLAP डेटा के बहुआयामी विचारों के लिए सरणी-आधारित बहुआयामी भंडारण इंजन का उपयोग करता है। यदि डेटा सेट विरल है, तो बहुआयामी डेटा स्टोर के साथ, भंडारण उपयोग कम हो सकता है। इसलिए, कई MOLAP सर्वर घने और विरल डेटा सेट को संभालने के लिए दो स्तर के डेटा स्टोरेज प्रतिनिधित्व का उपयोग करते हैं।

हाइब्रिड OLAP

हाइब्रिड OLAP, ROLAP और MOLAP दोनों का एक संयोजन है। यह ROLAP की उच्च मापनीयता और MOLAP की तेजी से गणना प्रदान करता है। HOLAP सर्वर विस्तृत जानकारी के बड़े डेटा संस्करणों को संग्रहीत करने की अनुमति देता है। एकत्रीकरण को MOLAP स्टोर में अलग से संग्रहीत किया जाता है।

विशिष्ट SQL सर्वर

विशिष्ट SQL सर्वर, केवल-पढ़ने वाले वातावरण में स्टार और स्नोफ्लेक स्कीमा पर SQL क्वेरी के लिए उन्नत क्वेरी भाषा और क्वेरी प्रोसेसिंग समर्थन प्रदान करते हैं।

OLAP संचालन

चूंकि OLAP सर्वर डेटा के बहुआयामी दृश्य पर आधारित होते हैं, इसलिए हम OLAP संचालन पर बहुआयामी डेटा पर चर्चा करेंगे।

यहां OLAP संचालन की सूची दी गई है -

  • Roll-up
  • Drill-down
  • टुकड़ा और पासा
  • धुरी (घूमना)

जमना

निम्नलिखित में से किसी भी तरीके से डेटा-क्यूब पर रोल-अप एकत्रीकरण करता है -

  • एक आयाम के लिए एक अवधारणा पदानुक्रम ऊपर चढ़ने से
  • आयाम में कमी से

निम्नलिखित चित्र दिखाता है कि रोल-अप कैसे काम करता है।

  • रोल-अप आयाम स्थान के लिए एक अवधारणा पदानुक्रम पर चढ़कर किया जाता है।

  • प्रारंभ में अवधारणा पदानुक्रम "सड़क <शहर <प्रांत <देश" था।

  • रोल अप करने पर, डेटा को शहर के स्तर से देश के स्तर तक स्थान पदानुक्रम को जोड़कर एकत्र किया जाता है।

  • डेटा देशों के बजाय शहरों में समूहीकृत है।

  • जब रोल-अप किया जाता है, तो डेटा क्यूब से एक या अधिक आयाम हटा दिए जाते हैं।

ड्रिल द्वारा छेद बनाएं

ड्रिल-डाउन, रोल-अप का रिवर्स ऑपरेशन है। यह निम्नलिखित तरीकों से किया जाता है -

  • एक आयाम के लिए एक अवधारणा पदानुक्रम को नीचे करके
  • एक नए आयाम की शुरुआत करके।

निम्नलिखित चित्र दिखाता है कि ड्रिल-डाउन कैसे काम करता है -

  • आयाम समय के लिए एक अवधारणा पदानुक्रम को नीचे करके ड्रिल-डाउन किया जाता है।

  • प्रारंभ में अवधारणा पदानुक्रम "दिन <माह <तिमाही <वर्ष" था।

  • नीचे ड्रिलिंग करने पर, समय का आयाम तिमाही के स्तर से महीने के स्तर तक उतर जाता है।

  • जब ड्रिल-डाउन किया जाता है, तो डेटा क्यूब से एक या अधिक आयाम जोड़े जाते हैं।

  • यह कम विस्तृत डेटा से लेकर अत्यधिक विस्तृत डेटा तक नेविगेट करता है।

टुकड़ा

टुकड़ा ऑपरेशन किसी दिए गए घन से एक विशेष आयाम का चयन करता है और एक नया उप-घन प्रदान करता है। निम्नलिखित आरेख पर विचार करें जो दिखाता है कि टुकड़ा कैसे काम करता है।

  • यहां स्लाइस को मानदंड समय = "Q1" का उपयोग करते हुए आयाम "समय" के लिए किया जाता है।

  • यह एक या अधिक आयामों का चयन करके एक नया उप-घन बनाएगा।

पासा

पासा किसी दिए गए घन से दो या अधिक आयामों का चयन करता है और एक नया उप घन प्रदान करता है। निम्नलिखित आरेख पर विचार करें जो पासा संचालन को दर्शाता है।

निम्नलिखित चयन मानदंडों के आधार पर क्यूब पर पासा संचालन में तीन आयाम शामिल हैं।

  • (स्थान = "टोरंटो" या "वैंकूवर")
  • (समय = "Q1" या "Q2")
  • (आइटम = "मोबाइल" या "मोडेम")

प्रधान आधार

धुरी संचालन को रोटेशन के रूप में भी जाना जाता है। यह डेटा की वैकल्पिक प्रस्तुति प्रदान करने के लिए डेटा अक्षों को घूमता है। निम्नलिखित आरेख पर विचार करें जो धुरी संचालन को दर्शाता है।

OLAP बनाम OLTP

अनु क्रमांक। डेटा वेयरहाउस (OLAP) ऑपरेशनल डेटाबेस (OLTP)
1 सूचना के ऐतिहासिक प्रसंस्करण को शामिल करता है। दिन-प्रतिदिन की प्रक्रिया को शामिल करता है।
2 OLAP सिस्टम का उपयोग ज्ञान श्रमिकों जैसे कि अधिकारियों, प्रबंधकों और विश्लेषकों द्वारा किया जाता है। OLTP सिस्टम क्लर्क, DBA, या डेटाबेस पेशेवरों द्वारा उपयोग किया जाता है।
3 व्यवसाय के विश्लेषण में उपयोगी है। व्यवसाय चलाने में उपयोगी।
4 यह सूचना बाहर पर केंद्रित है। यह डेटा पर केंद्रित है।
5 स्टार स्कीमा, स्नोफ्लेक, स्कीमा और तथ्य नक्षत्र स्कीमा के आधार पर। इकाई संबंध मॉडल के आधार पर।
6 ऐतिहासिक डेटा समाहित करता है। वर्तमान डेटा शामिल हैं।
7 सारांशित और समेकित डेटा प्रदान करता है। आदिम और अत्यधिक विस्तृत डेटा प्रदान करता है।
8 डेटा का सारांश और बहुआयामी दृश्य प्रदान करता है। डेटा का विस्तृत और सपाट संबंधपरक दृष्टिकोण प्रदान करता है।
9 संख्या या उपयोगकर्ता सैकड़ों में हैं। यूजर्स की संख्या हजारों में है।
10 एक्सेस किए गए रिकॉर्ड की संख्या लाखों में है। एक्सेस किए गए रिकॉर्ड की संख्या दसियों में है।
1 1 डेटाबेस का आकार 100 जीबी से 1 टीबी तक है डेटाबेस का आकार 100 एमबी से 1 जीबी तक है।
12 अत्यधिक लचीला। उच्च प्रदर्शन प्रदान करता है।