वितरित सिस्टम में क्वेरी ऑप्टिमाइज़ेशन
यह अध्याय वितरित डेटाबेस सिस्टम में क्वेरी ऑप्टिमाइज़ेशन पर चर्चा करता है।
वितरित क्वेरी प्रसंस्करण वास्तुकला
वितरित डेटाबेस प्रणाली में, क्वेरी को संसाधित करने में वैश्विक और स्थानीय दोनों स्तरों पर अनुकूलन शामिल होता है। क्वेरी क्लाइंट या कंट्रोलिंग साइट पर डेटाबेस सिस्टम में प्रवेश करती है। यहां, उपयोगकर्ता को मान्य किया गया है, क्वेरी को वैश्विक स्तर पर जांचा, अनुवादित और अनुकूलित किया गया है।
वास्तुकला को इस रूप में दर्शाया जा सकता है -
ग्लोबल क्वेरीज़ को स्थानीय क्वेरी में मैप करना
स्थानीय लोगों को वैश्विक प्रश्नों के मानचित्रण की प्रक्रिया निम्नानुसार महसूस की जा सकती है -
वैश्विक क्वेरी में आवश्यक तालिकाओं में कई साइटों पर वितरित किए गए टुकड़े होते हैं। स्थानीय डेटाबेस में केवल स्थानीय डेटा के बारे में जानकारी होती है। नियंत्रण साइट वितरण के बारे में जानकारी इकट्ठा करने और टुकड़ों से वैश्विक दृश्य को फिर से संगठित करने के लिए वैश्विक डेटा शब्दकोश का उपयोग करती है।
यदि कोई प्रतिकृति नहीं है, तो वैश्विक ऑप्टिमाइज़र उन साइटों पर स्थानीय क्वेरी चलाता है जहां टुकड़े संग्रहीत हैं। यदि प्रतिकृति है, तो वैश्विक अनुकूलक संचार लागत, कार्यभार और सर्वर गति के आधार पर साइट का चयन करता है।
वैश्विक ऑप्टिमाइज़र एक वितरित निष्पादन योजना बनाता है ताकि साइटों में कम से कम डेटा स्थानांतरण हो सके। योजना में अंशों का स्थान बताया गया है, जिसके क्रम में क्वेरी चरणों को निष्पादित करने की आवश्यकता है और प्रक्रियाएं मध्यवर्ती परिणामों को स्थानांतरित करने में शामिल हैं।
स्थानीय डेटाबेस सर्वर द्वारा स्थानीय प्रश्नों को अनुकूलित किया जाता है। अंत में, स्थानीय क्वेरी परिणामों को क्षैतिज अंशों के मामले में यूनियन ऑपरेशन के माध्यम से एक साथ विलय कर दिया जाता है और ऊर्ध्वाधर टुकड़ों के लिए ऑपरेशन में शामिल हो जाता है।
उदाहरण के लिए, विचार करें कि निम्नलिखित प्रोजेक्ट स्कीमा शहर, नई दिल्ली, कोलकाता और हैदराबाद होने वाले शहरों के अनुसार क्षैतिज रूप से खंडित है।
परियोजना
पीआईडी | Faridabad | विभाग | स्थिति |
मान लीजिए कि उन सभी परियोजनाओं का विवरण प्राप्त करने के लिए एक क्वेरी है जिनकी स्थिति "चालू" है।
वैश्विक क्वेरी & inus होगी;
$$ \ sigma_ {स्थिति} = {\ _ "चल रहा है"} ^ {(PROJECT)} $ $
नई दिल्ली के सर्वर में क्वेरी होगी -
$$ \ sigma_ {स्थिति} = {\ _ "छोटा" चल रहा है}} ^ {({NewD} _- {PROJECT})} $$
कोलकाता के सर्वर में क्वेरी होगी -
$$ \ sigma_ {स्थिति} = {\ _ "चल रहा है"} ^ {({Kol} _- {PROJECT})} $$
हैदराबाद के सर्वर में क्वेरी होगी -
$$ \ sigma_ {status} = {\ _ "चल रहा है"} ^ {({Hyd} _- {PROJECT})} $$
समग्र परिणाम प्राप्त करने के लिए, हमें तीन प्रश्नों के परिणामों को निम्नानुसार संघबद्ध करना होगा -
$ \ _ sigma_ {स्थिति} = {\ _ "छोटा चल रहा है"} ^ {({NewD} _- {PROJECT})} \ _ \ _ \ _ "sigma_ {status} = {\ _" चल रहा है "} ^ {{{{} {PROJECT})} \ कप \ sigma_ {स्थिति} = {\ _ "छोटा चल रहा है"} ^ {({Hyd} _- {PROJECT})} $
वितरित क्वेरी ऑप्टिमाइज़ेशन
वितरित क्वेरी ऑप्टिमाइज़ेशन के लिए बड़ी संख्या में क्वेरी ट्री के मूल्यांकन की आवश्यकता होती है, जिनमें से प्रत्येक क्वेरी के आवश्यक परिणाम उत्पन्न करता है। यह मुख्य रूप से बड़ी मात्रा में प्रतिकृति और खंडित डेटा की उपस्थिति के कारण है। इसलिए, लक्ष्य सबसे अच्छा समाधान के बजाय एक इष्टतम समाधान खोजने का है।
वितरित क्वेरी अनुकूलन के लिए मुख्य मुद्दे हैं -
- वितरित प्रणाली में संसाधनों का इष्टतम उपयोग।
- क्वेरी ट्रेडिंग।
- क्वेरी के समाधान स्थान को कम करना।
वितरित प्रणाली में संसाधनों का इष्टतम उपयोग
वितरित सिस्टम में क्वेरी से संबंधित ऑपरेशन करने के लिए विभिन्न साइटों में कई डेटाबेस सर्वर होते हैं। इष्टतम संसाधन उपयोग के लिए दृष्टिकोण निम्नलिखित हैं -
Operation Shipping- ऑपरेशन शिपिंग में, ऑपरेशन उस साइट पर चलाया जाता है जहां डेटा संग्रहीत है और क्लाइंट साइट पर नहीं। फिर परिणाम क्लाइंट साइट पर स्थानांतरित कर दिए जाते हैं। यह उन ऑपरेशनों के लिए उपयुक्त है जहां ऑपरेटर उसी साइट पर उपलब्ध हैं। उदाहरण: चयन और परियोजना संचालन।
Data Shipping- डेटा शिपिंग में, डेटा टुकड़े डेटाबेस सर्वर में स्थानांतरित किए जाते हैं, जहां संचालन निष्पादित होते हैं। यह उन ऑपरेशनों में उपयोग किया जाता है जहां ऑपरेंड्स को विभिन्न साइटों पर वितरित किया जाता है। यह उन प्रणालियों में भी उचित है जहां संचार लागत कम है, और स्थानीय प्रोसेसर क्लाइंट सर्वर की तुलना में बहुत धीमा हैं।
Hybrid Shipping- यह डेटा और ऑपरेशन शिपिंग का एक संयोजन है। यहां, डेटा टुकड़े उच्च गति वाले प्रोसेसर में स्थानांतरित किए जाते हैं, जहां ऑपरेशन चलता है। फिर परिणाम ग्राहक साइट पर भेजे जाते हैं।
क्वेरी ट्रेडिंग
वितरित डेटाबेस सिस्टम के लिए क्वेरी ट्रेडिंग एल्गोरिथ्म में, वितरित क्वेरी के लिए नियंत्रण / ग्राहक साइट को खरीदार और उन साइटों को कहा जाता है जहां स्थानीय क्वेरी निष्पादित होती हैं, उन्हें विक्रेता कहा जाता है। खरीदार विक्रेताओं को चुनने और वैश्विक परिणामों के पुनर्निर्माण के लिए कई विकल्प तैयार करता है। खरीदार का लक्ष्य इष्टतम लागत को प्राप्त करना है।
एल्गोरिथ्म खरीदार के साथ शुरू होता है जो विक्रेता साइटों को उप-प्रश्न बताता है। अंतिम योजना के पुनर्निर्माण के लिए संचार लागत के साथ संयुक्त विक्रेताओं द्वारा प्रस्तावित स्थानीय अनुकूलित क्वेरी योजनाओं से इष्टतम योजना बनाई गई है। वैश्विक इष्टतम योजना तैयार होने के बाद, क्वेरी निष्पादित की जाती है।
क्वेरी के समाधान स्थान की कमी
इष्टतम समाधान में आम तौर पर समाधान स्थान की कमी शामिल होती है ताकि क्वेरी और डेटा हस्तांतरण की लागत कम हो। यह केंद्रीय नियमों में उत्तराधिकार के रूप में, न्यायिक नियमों के एक सेट के माध्यम से प्राप्त किया जा सकता है।
निम्नलिखित कुछ नियम हैं -
जितना जल्दी हो सके चयन और प्रक्षेपण संचालन करें। यह संचार नेटवर्क पर डेटा प्रवाह को कम करता है।
चयन की शर्तों को समाप्त करके क्षैतिज टुकड़ों पर संचालन को सरल बनाएं जो किसी विशेष साइट के लिए प्रासंगिक नहीं हैं।
कई साइटों में स्थित अंशों के शामिल होने और संघ संचालन के मामले में, खंडित डेटा को उस स्थान पर स्थानांतरित करना जहां अधिकांश डेटा मौजूद है और वहां ऑपरेशन करते हैं।
जुड़ने वाले ट्यूपल्स को अर्हता प्राप्त करने के लिए अर्ध-ज्वाइन ऑपरेशन का उपयोग करें। यह डेटा ट्रांसफर की मात्रा को कम करता है जो बदले में संचार लागत को कम करता है।
एक वितरित क्वेरी ट्री में आम पत्तियों और उप-पेड़ों को मिलाएं।