अपाचे प्रेस्टो - आर्किटेक्चर
प्रेस्टो की वास्तुकला लगभग क्लासिक एमपीपी (बड़े पैमाने पर समानांतर प्रसंस्करण) डीबीएमएस वास्तुकला के समान है। निम्नलिखित चित्र प्रेस्टो की वास्तुकला को दर्शाता है।
उपरोक्त आरेख में विभिन्न घटक होते हैं। निम्नलिखित तालिका प्रत्येक घटक के बारे में विस्तार से बताती है।
S.No | घटक विवरण |
---|---|
1। | Client क्लाइंट (प्रेस्टो सीएलआई) परिणाम प्राप्त करने के लिए एक समन्वयक के लिए एसक्यूएल बयान प्रस्तुत करता है। |
2। | Coordinator समन्वयक एक मास्टर डेमॉन है। समन्वयक प्रारंभ में SQL क्वेरीज़ का विश्लेषण करता है और फिर क्वेरी निष्पादन के लिए योजना बनाता है। शेड्यूलर पाइपलाइन निष्पादन करता है, निकटतम नोड को काम सौंपता है और प्रगति की निगरानी करता है। |
3। | Connector स्टोरेज प्लगइन्स को कनेक्टर के रूप में कहा जाता है। छत्ता, HBase, MySQL, कैसेंड्रा और एक कनेक्टर के रूप में कई और कार्य; अन्यथा आप एक कस्टम भी लागू कर सकते हैं। कनेक्टर प्रश्नों के लिए मेटाडेटा और डेटा प्रदान करता है। समन्वयक क्वेरी प्लान बनाने के लिए मेटाडेटा प्राप्त करने के लिए कनेक्टर का उपयोग करता है। |
4। | Worker समन्वयक कार्यकर्ता नोड्स को कार्य सौंपता है। श्रमिकों को कनेक्टर से वास्तविक डेटा मिलता है। अंत में, कार्यकर्ता नोड क्लाइंट को परिणाम देता है। |
प्रेस्टो - वर्कफ़्लो
प्रेस्टो एक वितरित प्रणाली है जो नोड्स के क्लस्टर पर चलती है। प्रेस्टो के वितरित क्वेरी इंजन को इंटरैक्टिव विश्लेषण के लिए अनुकूलित किया गया है और जटिल एएनएसआई एसक्यूएल का समर्थन करता है, जिसमें जटिल प्रश्न, एकत्रीकरण, जुड़ाव और विंडो फ़ंक्शन शामिल हैं। प्रेस्टो आर्किटेक्चर सरल और एक्स्टेंसिबल है। प्रेस्टो क्लाइंट (सीएलआई) एसक्यूएल स्टेटमेंट को एक मास्टर डेमोन कोऑर्डिनेटर को सौंप देता है।
शेड्यूलर निष्पादन पाइपलाइन के माध्यम से जोड़ता है। शेड्यूलर नोड्स को काम सौंपता है जो डेटा के सबसे करीब है और प्रगति की निगरानी करता है। समन्वयक कई कार्यकर्ता नोड्स को कार्य सौंपता है और अंत में कार्यकर्ता नोड क्लाइंट को वापस परिणाम वितरित करता है। क्लाइंट आउटपुट प्रक्रिया से डेटा खींचता है। एक्स्टेंसिबिलिटी प्रमुख डिज़ाइन है। Hive, HBase, MySQL, आदि जैसे प्लग-इन कनेक्टर्स, मेटाडेटा और प्रश्नों के लिए डेटा प्रदान करता है। प्रेस्टो को "सरल भंडारण अमूर्तता" के साथ डिज़ाइन किया गया था जो इन विभिन्न प्रकार के डेटा स्रोतों के खिलाफ SQL क्वेरी क्षमता प्रदान करना आसान बनाता है।
निष्पादन मॉडल
प्रेस्टो कस्टम शब्दांश और निष्पादन इंजन का समर्थन करता है, जो एसक्यूएल शब्दार्थ का समर्थन करने के लिए डिज़ाइन किया गया है। शेड्यूलिंग में सुधार के अलावा, सभी प्रसंस्करण विभिन्न चरणों के बीच पूरे नेटवर्क में मेमोरी और पाइपलाइन में होते हैं। यह अनावश्यक I / O विलंबता ओवरहेड से बचा जाता है।