केंद्रीकृत प्रणालियों में क्वेरी अनुकूलन
एक बार संबंधपरक बीजगणित अभिव्यक्ति की गणना के लिए वैकल्पिक पहुंच पथ व्युत्पन्न हो जाते हैं, इष्टतम पहुँच पथ निर्धारित होता है। इस अध्याय में, हम केंद्रीकृत प्रणाली में क्वेरी ऑप्टिमाइज़ेशन पर ध्यान देंगे, जबकि अगले अध्याय में हम वितरित सिस्टम में क्वेरी ऑप्टिमाइज़ेशन का अध्ययन करेंगे।
एक केंद्रीकृत प्रणाली में, क्वेरी प्रोसेसिंग निम्नलिखित उद्देश्य से की जाती है -
क्वेरी की प्रतिक्रिया समय का न्यूनतमकरण (उपयोगकर्ता की क्वेरी के परिणाम उत्पन्न करने के लिए लिया गया समय)।
सिस्टम थ्रूपुट (अनुरोधों की संख्या जो किसी निश्चित समय में संसाधित होती है) को अधिकतम करें।
प्रसंस्करण के लिए आवश्यक मेमोरी और मेमोरी की मात्रा कम करें।
समानता बढ़ाएं।
क्वेरी पार्सिंग और अनुवाद
प्रारंभ में, SQL क्वेरी स्कैन की जाती है। फिर यह सिंटैक्टिकल त्रुटियों और डेटा प्रकारों की शुद्धता के लिए देखने के लिए तैयार है। यदि क्वेरी इस चरण से गुजरती है, तो क्वेरी को छोटे क्वेरी ब्लॉकों में विघटित कर दिया जाता है। प्रत्येक ब्लॉक को तब समतुल्य सापेक्ष बीजगणित अभिव्यक्ति के लिए अनुवादित किया जाता है।
क्वेरी ऑप्टिमाइज़ेशन के चरण
क्वेरी ऑप्टिमाइज़ेशन में तीन चरण होते हैं, अर्थात् क्वेरी ट्री जेनरेशन, प्लान जेनरेशन और क्वेरी प्लान कोड जेनरेशन।
Step 1 − Query Tree Generation
एक क्वेरी ट्री एक पेड़ डेटा संरचना है जो एक संबंधपरक बीजगणित अभिव्यक्ति का प्रतिनिधित्व करता है। क्वेरी के टेबल को लीफ नोड्स के रूप में दर्शाया गया है। रिलेशनल बीजगणित संचालन को आंतरिक नोड्स के रूप में दर्शाया गया है। रूट क्वेरी को संपूर्ण रूप में प्रस्तुत करता है।
निष्पादन के दौरान, एक आंतरिक नोड निष्पादित होता है जब भी इसकी ऑपरेंड टेबल उपलब्ध होती हैं। फिर नोड को परिणाम तालिका द्वारा बदल दिया जाता है। रूट नोड निष्पादित होने और परिणाम तालिका द्वारा प्रतिस्थापित किए जाने तक यह प्रक्रिया सभी आंतरिक नोड्स के लिए जारी रहती है।
उदाहरण के लिए, हम निम्नलिखित स्कीमाओं पर विचार करते हैं -
कर्मचारी
EmpID | Ename | वेतन | DeptNo | शामिल होने की तिथि |
विभाग
प्सकोव | DName | स्थान |
उदाहरण 1
आइए हम क्वेरी को निम्नलिखित मानते हैं।
$$ \ pi_ {EmpID} (\ sigma_ {EName = \ small "अरुणकुमार"} {(EMPLOYEE)}) $$
संबंधित क्वेरी ट्री होगा -
उदाहरण 2
आइए एक अन्य प्रश्न में शामिल होने पर विचार करें।
$ \ pi_ {नाम, वेतन} (\ sigma_ {DName = \ small "विपणन"} {{DEPARTMENT)}) \ bowtie_ {DNo = DeptNo} {(EMPLOADEE)} $
उपरोक्त क्वेरी के लिए क्वेरी ट्री निम्नलिखित है।
Step 2 − Query Plan Generation
क्वेरी ट्री जेनरेट होने के बाद, एक क्वेरी प्लान बनाया जाता है। क्वेरी प्लान एक विस्तारित क्वेरी ट्री है जिसमें क्वेरी ट्री में सभी परिचालनों के लिए पहुँच पथ शामिल हैं। पहुंच पथ निर्दिष्ट करते हैं कि पेड़ में रिलेशनल ऑपरेशन कैसे किए जाने चाहिए। उदाहरण के लिए, एक चयन ऑपरेशन में एक एक्सेस पथ हो सकता है जो चयन के लिए B + ट्री इंडेक्स के उपयोग के बारे में विवरण देता है।
इसके अलावा, एक क्वेरी योजना यह भी बताती है कि मध्यवर्ती तालिकाओं को एक ऑपरेटर से दूसरे में कैसे पारित किया जाना चाहिए, कैसे अस्थायी तालिकाओं का उपयोग किया जाना चाहिए और कैसे संचालन को पाइपलाइन / संयुक्त किया जाना चाहिए।
Step 3− Code Generation
कोड जेनरेशन क्वेरी ऑप्टिमाइज़ेशन का अंतिम चरण है। यह क्वेरी का निष्पादन योग्य रूप है, जिसका रूप अंतर्निहित ऑपरेटिंग सिस्टम के प्रकार पर निर्भर करता है। क्वेरी कोड उत्पन्न होने के बाद, निष्पादन प्रबंधक इसे चलाता है और परिणाम तैयार करता है।
क्वेरी ऑप्टिमाइज़ेशन के लिए दृष्टिकोण
क्वेरी ऑप्टिमाइज़ेशन, एक्सक्लूसिव सर्च और हेयूरिस्टिक्स-आधारित एल्गोरिदम के दृष्टिकोणों में से ज्यादातर का उपयोग किया जाता है।
व्यापक खोज अनुकूलन
इन तकनीकों में, एक क्वेरी के लिए, सभी संभावित क्वेरी प्लान शुरू में उत्पन्न होते हैं और फिर सबसे अच्छी योजना का चयन किया जाता है। हालांकि ये तकनीकें सबसे अच्छा समाधान प्रदान करती हैं, लेकिन इसका एक बड़ा समय और अंतरिक्ष जटिलता है जो बड़े समाधान स्थान के कारण है। उदाहरण के लिए, गतिशील प्रोग्रामिंग तकनीक।
अनुमान आधारित अनुकूलन
हेयुरिस्टिक आधारित अनुकूलन क्वेरी ऑप्टिमाइज़ेशन के लिए नियम-आधारित अनुकूलन दृष्टिकोण का उपयोग करता है। इन एल्गोरिदम में बहुपद और अंतरिक्ष की जटिलता है, जो संपूर्ण खोज-आधारित एल्गोरिदम की घातीय जटिलता से कम है। हालांकि, ये एल्गोरिदम जरूरी सर्वश्रेष्ठ क्वेरी प्लान नहीं बनाते हैं।
कुछ सामान्य नियम नियम हैं -
ऑपरेशन में शामिल होने से पहले सेलेक्ट और प्रोजेक्ट ऑपरेशन करें। यह क्वेरी ट्री को चुनिंदा और प्रोजेक्ट ऑपरेशन को स्थानांतरित करके किया जाता है। इससे जुड़ने के लिए उपलब्ध ट्यूपल्स की संख्या कम हो जाती है।
अन्य संचालन से पहले सबसे अधिक प्रतिबंधात्मक चयन / परियोजना संचालन करें।
क्रॉस-उत्पाद ऑपरेशन से बचें क्योंकि वे बहुत बड़े आकार के मध्यवर्ती तालिकाओं में परिणाम करते हैं।