अपाचे ताजो - वास्तुकला

निम्नलिखित दृष्टांत में अपाचे ताजो की वास्तुकला को दर्शाया गया है।

निम्न तालिका प्रत्येक घटक के बारे में विस्तार से बताती है।

क्र.सं. घटक विवरण
1

Client

Client परिणाम प्राप्त करने के लिए Tajo मास्टर को SQL स्टेटमेंट सबमिट करता है।

2

Master

मास्टर मुख्य डेमॉन है। यह क्वेरी प्लानिंग के लिए जिम्मेदार है और श्रमिकों के लिए समन्वयक है।

3

Catalog server

तालिका और सूचकांक विवरण बनाए रखता है। यह मास्टर डेमॉन में एम्बेडेड है। कैटलॉग सर्वर अपाचे डर्बी को भंडारण परत के रूप में उपयोग करता है और जेडीबीसी क्लाइंट के माध्यम से जोड़ता है।

4

Worker

मास्टर नोड कार्यकर्ता नोड्स को कार्य सौंपता है। TajoWorker डेटा प्रोसेस करता है। जैसे ही TajoWorkers की संख्या बढ़ती है, प्रसंस्करण क्षमता भी रैखिक रूप से बढ़ जाती है।

5

Query Master

Tajo मास्टर क्वेरी मास्टर को क्वेरी असाइन करता है। क्वेरी मास्टर वितरित निष्पादन योजना को नियंत्रित करने के लिए जिम्मेदार है। यह TaskRunner को लॉन्च करता है और TaskRunner को कार्य शेड्यूल करता है। क्वेरी मास्टर की मुख्य भूमिका चल रहे कार्यों की निगरानी करना और उन्हें मास्टर नोड को रिपोर्ट करना है।

6

Node Managers

कार्यकर्ता नोड के संसाधन का प्रबंधन करता है। यह नोड को अनुरोध आवंटित करने पर निर्णय लेता है।

7

TaskRunner

एक स्थानीय क्वेरी निष्पादन इंजन के रूप में कार्य करता है। इसका उपयोग क्वेरी प्रक्रिया को चलाने और मॉनिटर करने के लिए किया जाता है। टास्करनर एक समय में एक कार्य को संसाधित करता है।

इसकी निम्नलिखित तीन मुख्य विशेषताएं हैं -

  • तार्किक योजना - एक निष्पादन ब्लॉक जिसने कार्य बनाया।
  • एक टुकड़ा - एक इनपुट पथ, एक ऑफसेट सीमा और स्कीमा।
  • URIs प्राप्त करता है
8

Query Executor

इसका उपयोग किसी क्वेरी को निष्पादित करने के लिए किया जाता है।

9

Storage service

ताजो को अंतर्निहित डेटा संग्रहण जोड़ता है।

कार्यप्रवाह

Tajo स्टोरेज लेयर के रूप में Hadoop Distributed File System (HDFS) का उपयोग करता है और MapRure फ्रेमवर्क के बजाय इसका स्वयं का निष्पादन निष्पादन इंजन है। एक ताज़ो क्लस्टर में एक मास्टर नोड और क्लस्टर नोड्स में कई कार्यकर्ता होते हैं।

मास्टर मुख्य रूप से क्वेरी योजना और श्रमिकों के लिए समन्वयक के लिए जिम्मेदार है। मास्टर एक क्वेरी को छोटे कार्यों में विभाजित करता है और श्रमिकों को सौंपता है। प्रत्येक कार्यकर्ता के पास एक स्थानीय क्वेरी इंजन होता है जो भौतिक ऑपरेटरों के निर्देशित एसाइक्लिक ग्राफ को निष्पादित करता है।

इसके अलावा, Tajo वितरित डेटा प्रवाह को MapReduce की तुलना में अधिक लचीला नियंत्रित कर सकता है और अनुक्रमण तकनीकों का समर्थन करता है।

Tajo के वेब-आधारित इंटरफ़ेस में निम्नलिखित क्षमताएं हैं -

  • सबमिट किए गए प्रश्नों की योजना कैसे बनाई जाए, यह जानने का विकल्प
  • यह पता लगाने का विकल्प कि प्रश्नों को नोड्स में कैसे वितरित किया जाता है
  • क्लस्टर और नोड्स की स्थिति की जांच करने का विकल्प