ईटीएल - परिचय

ETL का मतलब एक्सट्रैक्ट, ट्रांसफॉर्म और लोड है। ईटीएल उपकरण विभिन्न आरडीबीएमएस स्रोत प्रणालियों से डेटा को निकालता है, डेटा को गणना, समवर्ती, आदि को लागू करने और फिर डेटा को डेटा वेयरहाउस सिस्टम में लोड करता है। डेटा को DW सिस्टम में आयाम और तथ्य तालिकाओं के रूप में लोड किया जाता है।

निष्कर्षण

  • ETL लोड के दौरान एक स्टेजिंग क्षेत्र की आवश्यकता होती है। स्टेजिंग क्षेत्र की आवश्यकता के विभिन्न कारण हैं।

  • स्रोत प्रणालियां केवल डेटा निकालने के लिए विशिष्ट अवधि के लिए उपलब्ध हैं। समय की यह अवधि कुल डेटा-लोड समय से कम है। इसलिए, स्टेजिंग क्षेत्र आपको स्रोत सिस्टम से डेटा निकालने की अनुमति देता है और समय स्लॉट समाप्त होने से पहले इसे स्टेजिंग क्षेत्र में रखता है।

  • स्टेजिंग क्षेत्र की आवश्यकता तब होती है जब आप एक साथ कई डेटा स्रोतों से डेटा प्राप्त करना चाहते हैं या यदि आप एक साथ दो या अधिक सिस्टम से जुड़ना चाहते हैं। उदाहरण के लिए, आप दो अलग-अलग डेटाबेस से दो तालिकाओं में शामिल होने वाली SQL क्वेरी करने में सक्षम नहीं होंगे।

  • अलग-अलग सिस्टम के लिए डेटा एक्सट्रैक्ट्स का टाइम स्लॉट टाइम ज़ोन और ऑपरेशनल घंटों के अनुसार अलग-अलग होता है।

  • स्रोत सिस्टम से निकाले गए डेटा का उपयोग कई डेटा वेयरहाउस सिस्टम, ऑपरेशन डेटा स्टोर आदि में किया जा सकता है।

  • ईटीएल आपको जटिल परिवर्तन करने की अनुमति देता है और डेटा को स्टोर करने के लिए अतिरिक्त क्षेत्र की आवश्यकता होती है।

परिवर्तन

डेटा परिवर्तन में, आप निकाले गए डेटा पर फ़ंक्शंस का एक सेट इसे लक्ष्य प्रणाली में लोड करने के लिए लागू करते हैं। डेटा, जिसे किसी भी परिवर्तन की आवश्यकता नहीं होती है उसे प्रत्यक्ष चाल या डेटा के माध्यम से जाना जाता है।

आप स्रोत प्रणाली से निकाले गए डेटा पर विभिन्न परिवर्तनों को लागू कर सकते हैं। उदाहरण के लिए, आप अनुकूलित गणना कर सकते हैं। यदि आप सम-बिक्री राजस्व चाहते हैं और यह डेटाबेस में नहीं है, तो आप आवेदन कर सकते हैंSUM परिवर्तन के दौरान सूत्र और डेटा लोड।

उदाहरण के लिए, यदि आपके पास अलग-अलग स्तंभों में तालिका में पहला नाम और अंतिम नाम है, तो आप लोड करने से पहले कॉनेटेट का उपयोग कर सकते हैं।

भार

लोड चरण के दौरान, डेटा को अंतिम-लक्ष्य प्रणाली में लोड किया जाता है और यह एक फ्लैट फ़ाइल या डेटा वेयरहाउस सिस्टम हो सकता है।