अपाचे प्रेस्टो - त्वरित गाइड

डेटा एनालिटिक्स बेहतर निर्णय लेने के लिए प्रासंगिक जानकारी इकट्ठा करने के लिए कच्चे डेटा का विश्लेषण करने की प्रक्रिया है। यह मुख्य रूप से कई संगठनों में व्यावसायिक निर्णय लेने के लिए उपयोग किया जाता है। खैर, बड़े डेटा एनालिटिक्स में बड़ी मात्रा में डेटा शामिल होता है और यह प्रक्रिया काफी जटिल है, इसलिए कंपनियां विभिन्न रणनीतियों का उपयोग करती हैं।

उदाहरण के लिए, फेसबुक दुनिया में अग्रणी डेटा संचालित और सबसे बड़ी डेटा वेयरहाउस कंपनी में से एक है। फेसबुक गोदाम डेटा बड़े पैमाने पर गणना के लिए Hadoop में संग्रहीत किया जाता है। बाद में, जब गोदाम डेटा पेटाबाइट्स में बढ़ गया, तो उन्होंने कम विलंबता के साथ एक नई प्रणाली विकसित करने का फैसला किया। 2012 के वर्ष में, फेसबुक टीम के सदस्यों ने डिजाइन किया“Presto” इंटरैक्टिव क्वेरी एनालिटिक्स के लिए जो डेटा के पेटाबाइट्स के साथ भी जल्दी से काम करेगा।

अपाचे प्रेस्टो क्या है?

अपाचे प्रेस्टो एक वितरित समानांतर क्वेरी निष्पादन इंजन है, जो कम विलंबता और इंटरैक्टिव क्वेरी विश्लेषण के लिए अनुकूलित है। प्रेस्टो आसानी से प्रश्नों को चलाता है और गीगाबाइट्स से पेटाबाइट्स तक समय के बिना भी स्केल करता है।

एक एकल प्रेस्टो क्वेरी HDFS, MySQL, कैसेंड्रा, हाइव और कई और अधिक डेटा स्रोतों जैसे कई स्रोतों से डेटा को संसाधित कर सकती है। प्रेस्टो जावा में बनाया गया है और अन्य डेटा अवसंरचना घटकों के साथ एकीकृत करने में आसान है। प्रेस्टो शक्तिशाली है, और Airbnb, DropBox, Groupon, Netflix जैसी अग्रणी कंपनियां इसे अपना रही हैं।

प्रेस्टो - सुविधाएँ

प्रेस्टो में निम्नलिखित विशेषताएं हैं -

  • सरल और एक्स्टेंसिबल वास्तुकला।
  • प्लग करने योग्य कनेक्टर - प्रेस्टो प्रश्नों के लिए मेटाडेटा और डेटा प्रदान करने के लिए प्लगेबल कनेक्टर का समर्थन करता है।
  • पाइपलाइन किए गए निष्पादन - अनावश्यक I / O विलंबता ओवरहेड से बचा जाता है।
  • उपयोगकर्ता-परिभाषित फ़ंक्शन - विश्लेषक आसानी से माइग्रेट करने के लिए कस्टम उपयोगकर्ता-परिभाषित फ़ंक्शन बना सकते हैं।
  • वेक्टरकृत स्तंभ प्रसंस्करण।

प्रेस्टो - लाभ

यहाँ अपाचे प्रेस्टो प्रदान करता है कि लाभों की एक सूची है -

  • विशिष्ट एसक्यूएल संचालन
  • स्थापित करने और डिबग करने में आसान
  • सरल भंडारण अमूर्त
  • कम विलंबता के साथ जल्दी से पेटाबाइट्स डेटा को स्केल करता है

प्रेस्टो - एप्लीकेशन

प्रेस्टो आज के सबसे अच्छे औद्योगिक अनुप्रयोगों का समर्थन करता है। आइए कुछ उल्लेखनीय अनुप्रयोगों पर एक नज़र डालें।

  • Facebook- फेसबुक ने डेटा एनालिटिक्स की जरूरतों के लिए प्रेस्टो का निर्माण किया। प्रेस्टो आसानी से डेटा के बड़े वेग को मापता है।

  • Teradata- टेराडाटा बिग डेटा एनालिटिक्स और डेटा वेयरहाउसिंग में एंड-टू-एंड समाधान प्रदान करता है। प्रेस्टा में टेराडाटा का योगदान अधिक कंपनियों के लिए सभी विश्लेषणात्मक आवश्यकताओं को सक्षम करना आसान बनाता है।

  • Airbnb- प्रेस्टो Airbnb डेटा इन्फ्रास्ट्रक्चर का एक अभिन्न हिस्सा है। खैर, प्रौद्योगिकी के साथ हर दिन सैकड़ों कर्मचारी पूछताछ कर रहे हैं।

प्रेस्टो क्यों?

प्रेस्टो मानक एएनएसआई एसक्यूएल का समर्थन करता है जिसने डेटा विश्लेषकों और डेवलपर्स के लिए इसे बहुत आसान बना दिया है। हालाँकि यह जावा में बनाया गया है, यह मेमोरी आवंटन और कचरा संग्रह से संबंधित जावा कोड के विशिष्ट मुद्दों से बचा जाता है। प्रेस्टो में एक कनेक्टर आर्किटेक्चर है जो हडोप फ्रेंडली है। यह फ़ाइल सिस्टम में आसानी से प्लग करने की अनुमति देता है।

प्रेस्टो कई Hadoop वितरण पर चलता है। इसके अलावा, प्रेस्टो एक हैडॉप प्लेटफॉर्म से कैसेंड्रा, रिलेशनल डेटाबेस या अन्य डेटा स्टोर को क्वेरी करने के लिए पहुंच सकता है। यह क्रॉस-प्लेटफ़ॉर्म एनालिटिक क्षमता प्रेस्टो उपयोगकर्ताओं को गीगाबाइट्स से डेटा के पेटाबाइट्स तक अधिकतम व्यावसायिक मूल्य निकालने की अनुमति देती है।

प्रेस्टो की वास्तुकला लगभग क्लासिक एमपीपी (बड़े पैमाने पर समानांतर प्रसंस्करण) डीबीएमएस वास्तुकला के समान है। निम्नलिखित चित्र प्रेस्टो की वास्तुकला को दर्शाता है।

उपरोक्त आरेख में विभिन्न घटक होते हैं। निम्नलिखित तालिका प्रत्येक घटक के बारे में विस्तार से बताती है।

S.No घटक विवरण
1।

Client

क्लाइंट (प्रेस्टो सीएलआई) परिणाम प्राप्त करने के लिए एक समन्वयक के लिए एसक्यूएल बयान प्रस्तुत करता है।

2।

Coordinator

समन्वयक एक मास्टर डेमॉन है। समन्वयक प्रारंभ में SQL क्वेरीज़ का विश्लेषण करता है और फिर क्वेरी निष्पादन के लिए योजना बनाता है। शेड्यूलर पाइपलाइन निष्पादन करता है, निकटतम नोड को काम सौंपता है और प्रगति की निगरानी करता है।

3।

Connector

स्टोरेज प्लगइन्स को कनेक्टर के रूप में कहा जाता है। छत्ता, HBase, MySQL, कैसेंड्रा और एक कनेक्टर के रूप में कई और कार्य; अन्यथा आप एक कस्टम भी लागू कर सकते हैं। कनेक्टर प्रश्नों के लिए मेटाडेटा और डेटा प्रदान करता है। समन्वयक क्वेरी प्लान बनाने के लिए मेटाडेटा प्राप्त करने के लिए कनेक्टर का उपयोग करता है।

4।

Worker

समन्वयक कार्यकर्ता नोड्स को कार्य सौंपता है। श्रमिकों को कनेक्टर से वास्तविक डेटा मिलता है। अंत में, कार्यकर्ता नोड क्लाइंट को परिणाम देता है।

प्रेस्टो - वर्कफ़्लो

प्रेस्टो एक वितरित प्रणाली है जो नोड्स के क्लस्टर पर चलती है। प्रेस्टो के वितरित क्वेरी इंजन को इंटरैक्टिव विश्लेषण के लिए अनुकूलित किया गया है और जटिल एएनएसआई एसक्यूएल का समर्थन करता है, जिसमें जटिल प्रश्न, एकत्रीकरण, जुड़ाव और विंडो फ़ंक्शन शामिल हैं। प्रेस्टो आर्किटेक्चर सरल और एक्स्टेंसिबल है। प्रेस्टो क्लाइंट (सीएलआई) एसक्यूएल स्टेटमेंट को एक मास्टर डेमोन कोऑर्डिनेटर को सौंप देता है।

शेड्यूलर निष्पादन पाइपलाइन के माध्यम से जोड़ता है। शेड्यूलर नोड्स को काम सौंपता है जो डेटा के सबसे करीब है और प्रगति की निगरानी करता है। समन्वयक कई कार्यकर्ता नोड्स को कार्य सौंपता है और अंत में कार्यकर्ता नोड क्लाइंट को वापस परिणाम वितरित करता है। क्लाइंट आउटपुट प्रक्रिया से डेटा खींचता है। एक्स्टेंसिबिलिटी प्रमुख डिज़ाइन है। Hive, HBase, MySQL, आदि जैसे प्लग-इन कनेक्टर्स, मेटाडेटा और प्रश्नों के लिए डेटा प्रदान करता है। प्रेस्टो को "सरल भंडारण अमूर्तता" के साथ डिज़ाइन किया गया था जो इन विभिन्न प्रकार के डेटा स्रोतों के खिलाफ SQL क्वेरी क्षमता प्रदान करना आसान बनाता है।

निष्पादन मॉडल

प्रेस्टो कस्टम शब्दांश और निष्पादन इंजन का समर्थन करता है, जो एसक्यूएल शब्दार्थ का समर्थन करने के लिए डिज़ाइन किया गया है। शेड्यूलिंग में सुधार के अलावा, सभी प्रसंस्करण विभिन्न चरणों के बीच पूरे नेटवर्क में मेमोरी और पाइपलाइन में होते हैं। यह अनावश्यक I / O विलंबता ओवरहेड से बचा जाता है।

यह अध्याय समझाएगा कि अपनी मशीन पर प्रेस्टो कैसे स्थापित करें। प्रेस्टो की बुनियादी आवश्यकताओं के माध्यम से चलते हैं,

  • लिनक्स या मैक ओएस
  • जावा संस्करण 8

अब, अपनी मशीन पर प्रेस्टो को स्थापित करने के लिए निम्नलिखित चरणों को जारी रखें।

जावा स्थापना का सत्यापन

उम्मीद है, आपने अभी जावा संस्करण 8 को अपनी मशीन पर पहले ही स्थापित कर लिया है, इसलिए आप केवल निम्नलिखित कमांड का उपयोग करके इसे सत्यापित करते हैं।

$ java -version

यदि जावा आपकी मशीन पर सफलतापूर्वक स्थापित है, तो आप स्थापित जावा का संस्करण देख सकते हैं। यदि जावा स्थापित नहीं है, तो अपनी मशीन पर जावा 8 को स्थापित करने के लिए बाद के चरणों का पालन करें।

JDK डाउनलोड करें। निम्नलिखित लिंक पर जाकर JDK का नवीनतम संस्करण डाउनलोड करें।

http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

नवीनतम संस्करण JDK 8u 92 है और फ़ाइल "jdk-8u92-linux-x64.tar.gz" है। कृपया अपनी मशीन पर फ़ाइल डाउनलोड करें।

उसके बाद, फ़ाइलों को निकालें और विशिष्ट निर्देशिका में स्थानांतरित करें।

फिर जावा विकल्प सेट करें। अंत में जावा आपकी मशीन पर स्थापित हो जाएगा।

अपाचे प्रेस्टो इंस्टॉलेशन

निम्नलिखित लिंक पर जाकर प्रेस्टो का नवीनतम संस्करण डाउनलोड करें,

https://repo1.maven.org/maven2/com/facebook/presto/presto-server/0.149/

अब “presto-server-0.149.tar.gz” का नवीनतम संस्करण आपकी मशीन पर डाउनलोड किया जाएगा।

टार फ़ाइलें निकालें

निकाले tar निम्नलिखित कमांड का उपयोग कर फ़ाइल -

$ tar  -zxf  presto-server-0.149.tar.gz 
$ cd presto-server-0.149

कॉन्फ़िगरेशन सेटिंग्स

"डेटा" निर्देशिका बनाएँ

स्थापना निर्देशिका के बाहर एक डेटा निर्देशिका बनाएं, जिसका उपयोग लॉग, मेटाडेटा, आदि के भंडारण के लिए किया जाएगा, ताकि प्रेस्टो को अपग्रेड करते समय इसे आसानी से संरक्षित किया जा सके। इसे निम्नलिखित कोड का उपयोग करके परिभाषित किया गया है -

$ cd  
$ mkdir data

उस पथ को देखने के लिए जहां यह स्थित है, कमांड "pwd" का उपयोग करें। यह स्थान अगले नोड.प्राय फाइल में निर्दिष्ट किया जाएगा।

"आदि" निर्देशिका बनाएँ

निम्नलिखित कोड का उपयोग करके प्रेस्टो इंस्टॉलेशन निर्देशिका के अंदर एक आदि निर्देशिका बनाएं -

$ cd presto-server-0.149 
$ mkdir etc

यह निर्देशिका कॉन्फ़िगरेशन फ़ाइलों को रखेगी। आइए एक-एक करके हर फाइल बनाते हैं।

नोड गुण

प्रेस्टो नोड गुण फ़ाइल में प्रत्येक नोड के लिए विशिष्ट पर्यावरण कॉन्फ़िगरेशन शामिल है। यह निम्नलिखित कोड का उपयोग करके निर्देशिका (आदि / नोड /properties) के अंदर बनाया गया है -

$ cd etc 
$ vi node.properties  

node.environment = production 
node.id = ffffffff-ffff-ffff-ffff-ffffffffffff 
node.data-dir = /Users/../workspace/Presto

सभी परिवर्तन करने के बाद, फ़ाइल को सहेजें, और टर्मिनल को छोड़ दें। यहाँnode.data उपरोक्त डेटा निर्देशिका का स्थान पथ है। node.id प्रत्येक नोड के लिए विशिष्ट पहचानकर्ता का प्रतिनिधित्व करता है।

जेवीएम विन्यास

आदि निर्देशिका (आदि / jvm.config) के अंदर एक फ़ाइल "jvm.config" बनाएँ। इस फ़ाइल में जावा वर्चुअल मशीन लॉन्च करने के लिए उपयोग की जाने वाली कमांड लाइन विकल्पों की एक सूची है।

$ cd etc 
$ vi jvm.config  

-server 
-Xmx16G 
-XX:+UseG1GC 
-XX:G1HeapRegionSize = 32M 
-XX:+UseGCOverheadLimit 
-XX:+ExplicitGCInvokesConcurrent 
-XX:+HeapDumpOnOutOfMemoryError 
-XX:OnOutOfMemoryError = kill -9 %p

सभी परिवर्तन करने के बाद, फ़ाइल को सहेजें, और टर्मिनल को छोड़ दें।

विन्यास गुण

आदि निर्देशिका (आदि / config.properties) के अंदर एक फ़ाइल "config.properties" बनाएँ। इस फ़ाइल में Presto सर्वर का विन्यास है। यदि आप परीक्षण के लिए एक मशीन स्थापित कर रहे हैं, तो प्रेस्टो सर्वर निम्नलिखित कोड का उपयोग करते हुए केवल समन्वय प्रक्रिया के रूप में कार्य कर सकता है -

$ cd etc 
$ vi config.properties  

coordinator = true 
node-scheduler.include-coordinator = true 
http-server.http.port = 8080 
query.max-memory = 5GB 
query.max-memory-per-node = 1GB 
discovery-server.enabled = true 
discovery.uri = http://localhost:8080

यहाँ,

  • coordinator - मास्टर नोड।

  • node-scheduler.include-coordinator - समन्वयक पर समयबद्धन कार्य की अनुमति देता है।

  • http-server.http.port - HTTP सर्वर के लिए पोर्ट निर्दिष्ट करता है।

  • query.max-memory=5GB - वितरित मेमोरी की अधिकतम मात्रा।

  • query.max-memory-per-node=1GB - प्रति नोड मेमोरी की अधिकतम मात्रा।

  • discovery-server.enabled - प्रेस्टो डिस्कवरी सेवा का उपयोग क्लस्टर में सभी नोड्स को खोजने के लिए करता है।

  • discovery.uri - वह डिस्कवरी सर्वर के लिए यूआरआई।

यदि आप कई मशीन प्रेस्टो सर्वर स्थापित कर रहे हैं, तो प्रेस्टो समन्वय और कार्यकर्ता प्रक्रिया दोनों के रूप में कार्य करेगा। कई मशीनों पर प्रेस्टो सर्वर का परीक्षण करने के लिए इस कॉन्फ़िगरेशन सेटिंग का उपयोग करें।

समन्वयक के लिए विन्यास

$ cd etc 
$ vi config.properties  

coordinator = true 
node-scheduler.include-coordinator = false 
http-server.http.port = 8080 
query.max-memory = 50GB 
query.max-memory-per-node = 1GB 
discovery-server.enabled = true 
discovery.uri = http://localhost:8080

वर्कर के लिए कॉन्फ़िगरेशन

$ cd etc 
$ vi config.properties  

coordinator = false 
http-server.http.port = 8080 
query.max-memory = 50GB 
query.max-memory-per-node = 1GB 
discovery.uri = http://localhost:8080

लॉग गुण

आदि निर्देशिका (आदि / log.properties) के अंदर एक फ़ाइल "log.properties" बनाएँ। इस फ़ाइल में नामांकित पदानुक्रम के लिए न्यूनतम लॉग स्तर है। इसे निम्नलिखित कोड का उपयोग करके परिभाषित किया गया है -

$ cd etc 
$ vi log.properties  
com.facebook.presto = INFO

फ़ाइल सहेजें और टर्मिनल से बाहर निकलें। यहां, चार लॉग स्तरों का उपयोग किया जाता है, जैसे डेबग, इन्फो, वॉर्न और एरोर। डिफ़ॉल्ट लॉग स्तर INFO है।

कैटलॉग गुण

निर्देशिका (आदि / कैटलॉग) के अंदर एक निर्देशिका "कैटलॉग" बनाएँ। यह बढ़ते डेटा के लिए उपयोग किया जाएगा। उदाहरण के लिए, बनाएँetc/catalog/jmx.properties निम्नलिखित सामग्री के साथ माउंट करने के लिए jmx connector जेएमएक्स सूची के रूप में -

$ cd etc 
$ mkdir catalog $ cd catalog 
$ vi jmx.properties  
connector.name = jmx

प्रेस्टो शुरू करो

प्रेस्टो को निम्नलिखित कमांड का उपयोग करके शुरू किया जा सकता है,

$ bin/launcher start

फिर आप इस के समान प्रतिक्रिया देखेंगे,

Started as 840

प्रेस्टो चलाएं

प्रेस्टो सर्वर लॉन्च करने के लिए, निम्नलिखित कमांड का उपयोग करें -

$ bin/launcher run

प्रेस्टो सर्वर को सफलतापूर्वक लॉन्च करने के बाद, आप लॉग फाइल को "var / log" डायरेक्टरी में पा सकते हैं।

  • launcher.log - यह लॉग लॉन्चर द्वारा बनाया गया है और सर्वर के stdout और stderr स्ट्रीम से जुड़ा है।

  • server.log - यह Presto द्वारा उपयोग की जाने वाली मुख्य लॉग फ़ाइल है।

  • http-request.log - सर्वर द्वारा प्राप्त HTTP अनुरोध।

अब तक, आपने अपनी मशीन पर Presto कॉन्फ़िगरेशन सेटिंग्स सफलतापूर्वक स्थापित कर ली हैं। आइए प्रेस्टो सीएलआई स्थापित करने के चरणों को जारी रखें।

प्रेस्टो सीएलआई स्थापित करें

प्रेस्टो सीएलआई प्रश्नों को चलाने के लिए एक टर्मिनल-आधारित इंटरैक्टिव शेल प्रदान करता है।

निम्नलिखित लिंक पर जाकर प्रेस्टो सीएलआई डाउनलोड करें,

https://repo1.maven.org/maven2/com/facebook/presto/presto-cli/0.149/

अब "presto-cli-0.149-execable.jar" आपकी मशीन पर स्थापित किया जाएगा।

सीएलआई चलाएं

प्रेस्टो-क्ली को डाउनलोड करने के बाद, इसे उस स्थान पर कॉपी करें जहां से आप इसे चलाना चाहते हैं। यह स्थान किसी भी नोड का हो सकता है जिसमें समन्वयक के लिए नेटवर्क पहुंच हो। सबसे पहले जार फाइल का नाम प्रेस्टो में बदलें। फिर इसके साथ निष्पादन योग्य बनाएंchmod + x निम्नलिखित कोड का उपयोग कर कमांड -

$ mv presto-cli-0.149-executable.jar presto  
$ chmod +x presto

अब निम्नलिखित कमांड का उपयोग करके CLI निष्पादित करें,

./presto --server localhost:8080 --catalog jmx --schema default  
Here jmx(Java Management Extension) refers to catalog and default referes to schema.

आप निम्न प्रतिक्रिया देखेंगे,

presto:default>

अब अपने टर्मिनल पर "jps" कमांड टाइप करें और आप चल रहे डेमोंस को देखेंगे।

प्रेस्टो बंद करो

सभी निष्पादन किए जाने के बाद, आप निम्नलिखित कमांड का उपयोग करके प्रेस्टो सर्वर को रोक सकते हैं -

$ bin/launcher stop

यह अध्याय प्रेस्टो के लिए कॉन्फ़िगरेशन सेटिंग्स पर चर्चा करेगा।

प्रेस्टो वेरिफायर

प्रेस्टो वेरिफ़ायर का उपयोग किसी अन्य डेटाबेस (जैसे MySQL) के विरुद्ध प्रेस्टो का परीक्षण करने के लिए, या एक दूसरे के विरुद्ध दो प्रेस्टो क्लस्टर्स का परीक्षण करने के लिए किया जा सकता है।

MySQL में डेटाबेस बनाएँ

MySQL सर्वर खोलें और निम्नलिखित कमांड का उपयोग करके एक डेटाबेस बनाएं।

create database test

अब आपने सर्वर में "परीक्षण" डेटाबेस बनाया है। तालिका बनाएं और इसे निम्नलिखित क्वेरी के साथ लोड करें।

CREATE TABLE verifier_queries( 
   id INT NOT NULL AUTO_INCREMENT, 
   suite VARCHAR(256) NOT NULL, 
   name VARCHAR(256), 
   test_catalog VARCHAR(256) NOT NULL, 
   test_schema VARCHAR(256) NOT NULL, 
   test_prequeries TEXT, 
   test_query TEXT NOT NULL, 
   test_postqueries TEXT, 
   test_username VARCHAR(256) NOT NULL default 'verifier-test', 
   test_password VARCHAR(256), 
   control_catalog VARCHAR(256) NOT NULL, 
   control_schema VARCHAR(256) NOT NULL, 
   control_prequeries TEXT, 
   control_query TEXT NOT NULL, 
   control_postqueries TEXT, 
   control_username VARCHAR(256) NOT NULL default 'verifier-test', 
   control_password VARCHAR(256), 
   session_properties_json TEXT,            
   PRIMARY KEY (id) 
);

कॉन्फ़िगरेशन सेटिंग्स जोड़ें

सत्यापनकर्ता को कॉन्फ़िगर करने के लिए एक गुण फ़ाइल बनाएँ -

$ vi config.properties  

suite = mysuite 
query-database = jdbc:mysql://localhost:3306/tutorials?user=root&password=pwd 
control.gateway = jdbc:presto://localhost:8080 
test.gateway = jdbc:presto://localhost:8080 
thread-count = 1

यहाँ, में query-database फ़ील्ड, निम्नलिखित विवरण दर्ज करें - mysql डेटाबेस का नाम, उपयोगकर्ता नाम और पासवर्ड।

JAR फ़ाइल डाउनलोड करें

निम्नलिखित लिंक पर जाकर प्रेस्टो-वेरिफायर जार फ़ाइल डाउनलोड करें,

https://repo1.maven.org/maven2/com/facebook/presto/presto-verifier/0.149/

अब संस्करण “presto-verifier-0.149-executable.jar” आपकी मशीन पर डाउनलोड किया गया है।

जेएआर निष्पादित करें

निम्न आदेश का उपयोग कर JAR फ़ाइल निष्पादित करें,

$ mv presto-verifier-0.149-executable.jar verifier  
$ chmod+x verifier

वेरिफायर चलाएं

निम्नलिखित कमांड का उपयोग करके सत्यापनकर्ता को चलाएं,

$ ./verifier config.properties

तालिका बनाएं

चलो एक सरल तालिका बनाते हैं “test” निम्नलिखित क्वेरी का उपयोग कर डेटाबेस।

create table product(id int not null, name varchar(50))

तलिका डालें

तालिका बनाने के बाद, निम्नलिखित क्वेरी का उपयोग करके दो रिकॉर्ड डालें,

insert into product values(1,’Phone') 
insert into product values(2,’Television’)

सत्यापनकर्ता क्वेरी चलाएँ

सत्यापनकर्ता परिणाम की जांच करने के लिए सत्यापनकर्ता टर्मिनल (./verifier config.propeties) में निम्नलिखित नमूना क्वेरी निष्पादित करें।

नमूना क्वेरी

insert into verifier_queries (suite, test_catalog, test_schema, test_query, 
control_catalog, control_schema, control_query) values 
('mysuite', 'mysql', 'default', 'select * from mysql.test.product', 
'mysql', 'default', 'select * from mysql.test.product');

यहाँ, select * from mysql.test.product क्वेरी mysql कैटलॉग को संदर्भित करता है, test डेटाबेस का नाम है और productतालिका का नाम है। इस तरह, आप प्रेस्टो सर्वर का उपयोग करके mysql कनेक्टर तक पहुंच सकते हैं।

यहां, प्रदर्शन देखने के लिए दो समान चुनिंदा प्रश्नों का एक दूसरे के खिलाफ परीक्षण किया जाता है। इसी तरह, आप प्रदर्शन परिणामों का परीक्षण करने के लिए अन्य क्वेरी चला सकते हैं। प्रदर्शन परिणामों की जांच करने के लिए आप दो प्रेस्टो समूहों को भी जोड़ सकते हैं।

इस अध्याय में, हम प्रेस्टो में प्रयुक्त प्रशासन उपकरणों पर चर्चा करेंगे। शुरुआत करते हैं प्रेस्टो के वेब इंटरफेस से।

वेब इंटरफेस

प्रेस्टो निगरानी और पूछताछ के प्रबंधन के लिए एक वेब इंटरफेस प्रदान करता है। इसे समन्वयक विन्यास गुण में निर्दिष्ट पोर्ट संख्या से एक्सेस किया जा सकता है।

प्रेस्टो सर्वर और प्रेस्टो सीएलआई शुरू करें। तब आप निम्न url से वेब इंटरफ़ेस तक पहुँच सकते हैं -http://localhost:8080/

आउटपुट उपरोक्त स्क्रीन के समान होगा।

यहां, मुख्य पृष्ठ में विशिष्ट क्वेरी आईडी, क्वेरी टेक्स्ट, क्वेरी स्थिति, प्रतिशत पूर्ण, उपयोगकर्ता नाम और स्रोत से जानकारी के साथ प्रश्नों की एक सूची है, जिससे यह क्वेरी उत्पन्न होती है। नवीनतम प्रश्न पहले चल रहे हैं, फिर पूर्ण किए गए या पूर्ण नहीं किए गए प्रश्नों को नीचे प्रदर्शित किया गया है।

प्रेस्टो पर प्रदर्शन ट्यूनिंग

यदि प्रेस्टो क्लस्टर में कोई प्रदर्शन-संबंधी समस्याएँ हैं, तो अपनी डिफ़ॉल्ट कॉन्फ़िगरेशन सेटिंग्स को निम्न सेटिंग्स में बदलें।

विन्यास गुण

  • task. info -refresh-max-wait - समन्वयक कार्य भार को कम करता है।

  • task.max-worker-threads - प्रक्रिया को विभाजित करता है और प्रत्येक श्रमिक नोड को असाइन करता है।

  • distributed-joins-enabled - हैश-आधारित वितरित जोड़।

  • node-scheduler.network-topology - अनुसूचक के लिए नेटवर्क टोपोलॉजी सेट करता है।

जेवीएम सेटिंग्स

अपनी डिफ़ॉल्ट JVM सेटिंग्स को निम्न सेटिंग्स में बदलें। यह कचरा संग्रहण के मुद्दों के निदान के लिए सहायक होगा।

-XX:+PrintGCApplicationConcurrentTime 
-XX:+PrintGCApplicationStoppedTime 
-XX:+PrintGCCause 
-XX:+PrintGCDateStamps 
-XX:+PrintGCTimeStamps 
-XX:+PrintGCDetails 
-XX:+PrintReferenceGC 
-XX:+PrintClassHistogramAfterFullGC 
-XX:+PrintClassHistogramBeforeFullGC 
-XX:PrintFLSStatistics = 2 
-XX:+PrintAdaptiveSizePolicy 
-XX:+PrintSafepointStatistics 
-XX:PrintSafepointStatisticsCount = 1

इस अध्याय में, हम प्रेस्टो पर प्रश्नों को बनाने और निष्पादित करने के तरीके के बारे में चर्चा करेंगे। हमें प्रेस्टो समर्थित बुनियादी डेटा प्रकारों के माध्यम से जाने दें।

बुनियादी डेटा प्रकार

निम्न तालिका प्रेस्टो के मूल डेटा प्रकारों का वर्णन करती है।

S.No डेटा प्रकार और विवरण
1।

VARCHAR

चर लंबाई चरित्र डेटा

2।

BIGINT

64-बिट हस्ताक्षरित पूर्णांक

3।

DOUBLE

64-बिट फ़्लोटिंग पॉइंट डबल सटीक मान

4।

DECIMAL

एक निश्चित सटीक दशमलव संख्या। उदाहरण के लिए DECIMAL (10,3) - 10 सटीक है, यानी अंकों की कुल संख्या और 3 को स्केल मान को भिन्नात्मक बिंदु के रूप में दर्शाया गया है। स्केल वैकल्पिक है और डिफ़ॉल्ट मान 0 है

5।

BOOLEAN

बूलियन मूल्यों को सही और गलत मानते हैं

6।

VARBINARY

चर लंबाई बाइनरी डेटा

7।

JSON

JSON डेटा

8।

DATE

वर्ष-माह-दिन के रूप में दिनांकित डेटा प्रकार

9।

TIME, TIMESTAMP, TIMESTAMP with TIME ZONE

समय - दिन का समय (घंटे-मिनट-सेकंड-मिनट)

TIMESTAMP - दिन की तारीख और समय

टाइम ज़ोन के साथ टाइमस्टैम्प - मूल्य से समय क्षेत्र के साथ दिन की तारीख और समय

10।

INTERVAL

तिथि और समय डेटा प्रकार बढ़ाएँ या बढ़ाएँ

1 1।

ARRAY

दिए गए घटक प्रकार की सरणी। उदाहरण के लिए, ARRAY [5,7]

12।

MAP

दिए गए घटक प्रकारों के बीच का नक्शा। उदाहरण के लिए, MAP (ARRAY ['एक', 'दो'], ARRAY [5,7])

13।

ROW

रो संरचना नाम क्षेत्रों से बना है

प्रेस्टो - ऑपरेटर्स

प्रेस्टो ऑपरेटरों को निम्न तालिका में सूचीबद्ध किया गया है।

S.No ऑपरेटर और विवरण
1। अंकगणित संचालक

प्रेस्टो +, -, *, /,% जैसे अंकगणितीय ऑपरेटरों का समर्थन करता है

2। संबंधित ऑपरेटर

<,>, <=,> =, =, <>

3। तार्किक संचालक

और, OR, नहीं

4। रेंज ऑपरेटर

रेंज ऑपरेटर का उपयोग किसी विशिष्ट रेंज में मूल्य का परीक्षण करने के लिए किया जाता है। प्रेस्टो BETWEEN, IS NULL, IS NOT NULL, GREATEST और LEAST का समर्थन करता है

5। दशमलव परिचालक

द्विआधारी अंकगणितीय दशमलव ऑपरेटर, दशमलव प्रकार के यूनिरी दशमलव ऑपरेटर के लिए बाइनरी अंकगणितीय ऑपरेशन करता है - - - operator उपेक्षा करता है

6। स्ट्रिंग ऑपरेटर

‘||’ operator स्ट्रिंग संघनन करता है

7। दिनांक और समय ऑपरेटर

तिथि और समय डेटा प्रकारों पर अंकगणितीय जोड़ और घटाव संचालन करता है

8। एरियर ऑपरेटर

सबस्क्रिप्ट ऑपरेटर [] - किसी ऐरे के तत्व तक पहुँचें

कॉन्टैक्शनेशन ऑपरेटर || - एक सरणी या एक ही प्रकार के एक तत्व के साथ एक सरणी को संक्षिप्त करें

9। मैप ऑपरेटर

मैप सबस्क्रिप्ट ऑपरेटर [] - किसी मानचित्र से दिए गए कुंजी के अनुरूप मान प्राप्त करता है

अब तक हम प्रेस्टो पर कुछ सरल बुनियादी प्रश्नों को चलाने पर चर्चा कर रहे थे। यह अध्याय महत्वपूर्ण एसक्यूएल कार्यों पर चर्चा करेगा।

गणित के कार्य

गणित के फार्मूले पर गणित के कार्य संचालित होते हैं। निम्नलिखित तालिका में विस्तार से कार्यों की सूची का वर्णन किया गया है।

क्र.सं. समारोह विवरण
1। पेट (एक्स)

का पूर्ण मूल्य लौटाता है x

2। cbrt (एक्स)

का घनमूल लौटाता है x

3। छत (एक्स)

लौटता है x मूल्य निकटतम पूर्णांक तक गोल है

4।

ceil(x)

छत के लिए उपनाम (x)

5। डिग्री (एक्स)

के लिए डिग्री मान लौटाता है x

6। ई (एक्स)

आयलर की संख्या के लिए डबल मान लौटाता है

7।

exp(x)

आयलर की संख्या के लिए घातांक मान लौटाता है

8। मंजिल (एक्स)

रिटर्न x निकटतम पूर्णांक तक गोल किया गया

9।

from_base(string,radix)

आधार-मूलांक संख्या के रूप में व्याख्या की गई स्ट्रिंग का मान लौटाता है

10।

ln(x)

का प्राकृतिक लघुगणक लौटाता है x

1 1। log2 (एक्स)

का आधार 2 लघुगणक देता है x

12।

log10(x)

का आधार 10 लघुगणक देता है x

13।

log(x,y)

आधार लौटाता है y का लघुगणक x

14। आधुनिक (n, m)

के मापांक (शेष) को लौटाता है n द्वारा विभाजित m

15।

pi()

पीआई मान लौटाता है। परिणाम को दोहरे मान के रूप में लौटाया जाएगा

16। बिजली (एक्स, पी)

मूल्य की शक्ति लौटाता है ‘p’ को x मूल्य

17।

pow(x,p)

बिजली के लिए उपनाम (एक्स, पी)

18। रेडियंस (एक्स)

कोण परिवर्तित करता है x डिग्री रेडियन में

19।

rand()

रेडियंस के लिए उपनाम ()

20। यादृच्छिक ()

छद्म यादृच्छिक मान लौटाता है

21।

rand(n)

यादृच्छिक के लिए उपनाम ()

22। दौर (एक्स)

एक्स के लिए गोल मूल्य देता है

23।

round(x,d)

x मूल्य के लिए गोल ‘d’ दशमलव स्थान

24।

sign(x)

X का साइनम फ़ंक्शन लौटाता है, अर्थात

0 अगर तर्क 0 है

1 यदि तर्क 0 से अधिक है

-1 अगर तर्क 0 से कम है

दोहरे तर्कों के लिए, फ़ंक्शन अतिरिक्त रूप से देता है -

यदि तर्क NaN है तो NaN

1 यदि तर्क + इन्फिनिटी है

-1 अगर तर्क है -इनफिनिटी

25। sqrt (एक्स)

का वर्गमूल देता है x

26। to_base (एक्स, मूलांक)

वापसी प्रकार आर्चर है। परिणाम के लिए आधार मूलांक के रूप में लौटाया जाता हैx

27। truncate (एक्स)

के लिए मूल्य को काटता है x

28। चौड़ाई_बकेट (x, बाउंड 1, बाउंड 2, एन)

के बिन नंबर देता है x निर्दिष्ट बाउंड 1 और बाउंड 2 सीमाएँ और बाल्टी की संख्या

29। चौड़ाई_बकेट (x, डिब्बे)

के बिन नंबर देता है x सरणी के डिब्बे द्वारा निर्दिष्ट डिब्बे के अनुसार

त्रिकोणमितीय फलन

त्रिकोणमितीय कार्य तर्कों को रेडियन () के रूप में दर्शाया गया है। निम्नलिखित तालिका कार्यों को सूचीबद्ध करती है।

S.No कार्य और विवरण
1। acos (एक्स)

व्युत्क्रम कोसाइन मान लौटाता है (x)

2।

asin(x)

व्युत्क्रम साइन मान लौटाता है (x)

3।

atan(x)

प्रतिलोम स्पर्शरेखा मान लौटाता है (x)

4। atan2 (y, x)

प्रतिलोम स्पर्शरेखा मान (y / x) लौटाता है

5।

cos(x)

लौकिक मान लौटाता है (x)

6। सोंटा (एक्स)

अतिशयोक्तिपूर्ण कोज्या मान लौटाता है (x)

7। sin (x)

साइन मान लौटाता है (x)

8।

tan(x)

स्पर्शरेखा मान लौटाता है (x)

9।

tanh(x)

हाइपरबोलिक स्पर्शरेखा मान लौटाता है (x)

बिटवाइज़ फ़ंक्शंस

निम्न तालिका बिटवाइज़ फ़ंक्शंस को सूचीबद्ध करती है।

S.No कार्य और विवरण
1। bit_count (x, बिट्स)

बिट्स की संख्या की गणना करें

2। bitwise_and (एक्स, वाई)

दो बिट्स के लिए बिटवाइज़ और ऑपरेशन करें, x तथा y

3। bitwise_or (एक्स, वाई)

दो बिट्स के बीच बिटवाइज या ऑपरेशन x, y

4। bitwise_not (एक्स)

बिटवाइस बिट के लिए नहीं ऑपरेशन x

5। bitwise_xor (एक्स, वाई)

बिट्स के लिए XOR ऑपरेशन x, y

स्ट्रिंग फ़ंक्शंस

निम्नलिखित तालिका स्ट्रिंग कार्यों को सूचीबद्ध करती है।

S.No कार्य और विवरण
1। समतल (string1, ..., stringN)

दिए गए तारों को समेटें

2। लंबाई (स्ट्रिंग)

दिए गए स्ट्रिंग की लंबाई लौटाता है

3। कम (स्ट्रिंग)

स्ट्रिंग के लिए लोअरकेस प्रारूप लौटाता है

4। ऊपरी (स्ट्रिंग)

दिए गए स्ट्रिंग के लिए अपरकेस प्रारूप लौटाता है

5। lpad (स्ट्रिंग, आकार, पैडस्ट्रिंग)

दिए गए स्ट्रिंग के लिए बायाँ गद्दी

6। ltrim (स्ट्रिंग)

स्ट्रिंग से अग्रणी व्हाट्सएप को हटाता है

7। बदलें (स्ट्रिंग, खोज, बदलें)

स्ट्रिंग मान को प्रतिस्थापित करता है

8। रिवर्स (स्ट्रिंग)

स्ट्रिंग के लिए किए गए ऑपरेशन को उलट देता है

9। रपैड (स्ट्रिंग, आकार, पैडस्ट्रिंग)

दिए गए स्ट्रिंग के लिए सही पैडिंग

10। rtrim (स्ट्रिंग)

स्ट्रिंग से अनुगामी व्हाट्सएप को हटाता है

1 1। विभाजन (स्ट्रिंग, सीमांकक)

स्ट्रिंग को सीमांकक पर विभाजित करता है और अधिकतम सीमा पर आकार की एक सरणी देता है

12। स्प्लिट_पार्ट (स्ट्रिंग, सीमांकक, सूचकांक)

स्ट्रिंग को सीमांकक पर विभाजित करता है और फ़ील्ड इंडेक्स लौटाता है

13। स्ट्रैप्स (स्ट्रिंग, सबस्ट्रिंग)

स्ट्रिंग में प्रतिस्थापन की प्रारंभिक स्थिति लौटाता है

14। पदार्थ (स्ट्रिंग, प्रारंभ)

दिए गए स्ट्रिंग के लिए सबस्ट्रिंग लौटाता है

15। पदार्थ (स्ट्रिंग, प्रारंभ, लंबाई)

विशिष्ट लंबाई के साथ दिए गए स्ट्रिंग के लिए विकल्प प्रदान करता है

16। ट्रिम (स्ट्रिंग)

स्ट्रिंग से अग्रणी और अनुगामी व्हाट्सएप को हटाता है

दिनांक और समय कार्य

निम्न तालिका दिनांक और समय कार्यों को सूचीबद्ध करती है।

S.No कार्य और विवरण
1। आज की तारीख

वर्तमान दिनांक लौटाता है

2। वर्तमान समय

वर्तमान समय लौटाता है

3। CURRENT_TIMESTAMP

वर्तमान टाइमस्टैम्प लौटाता है

4। CURRENT_TIMEZONE ()

वर्तमान समयक्षेत्र लौटाता है

5। अभी()

वर्तमान तिथि, समयक्षेत्र के साथ टाइमस्टैम्प लौटाता है

6। स्थानीय समय

स्थानीय समय लौटाता है

7। localtimestamp

स्थानीय टाइमस्टैम्प लौटाता है

नियमित अभिव्यक्ति के कार्य

निम्न तालिका नियमित अभिव्यक्ति कार्यों को सूचीबद्ध करती है।

S.No कार्य और विवरण
1। regexp_extract_all (स्ट्रिंग, पैटर्न)

पैटर्न के लिए नियमित अभिव्यक्ति द्वारा मिलान किए गए स्ट्रिंग को लौटाता है

2। regexp_extract_all (स्ट्रिंग, पैटर्न, समूह)

पैटर्न और समूह के लिए नियमित अभिव्यक्ति द्वारा मिलान किए गए स्ट्रिंग को लौटाता है

3। regexp_extract (स्ट्रिंग, पैटर्न)

पैटर्न के लिए नियमित अभिव्यक्ति द्वारा मिलान किए गए पहले प्रतिस्थापन को लौटाता है

4। regexp_extract (स्ट्रिंग, पैटर्न, समूह)

पैटर्न और समूह के लिए नियमित अभिव्यक्ति द्वारा मिलान किए गए पहले विकल्प को लौटाता है

5। regexp_like (स्ट्रिंग, पैटर्न)

पैटर्न के लिए स्ट्रिंग मिलान लौटाता है। यदि स्ट्रिंग वापस कर दी जाती है, तो मूल्य सही होगा अन्यथा गलत

6। regexp_replace (स्ट्रिंग, पैटर्न)

पैटर्न के साथ अभिव्यक्ति के लिए मिलान स्ट्रिंग के उदाहरण को बदलता है

7। regexp_replace (स्ट्रिंग, पैटर्न, प्रतिस्थापन)

पैटर्न और प्रतिस्थापन के साथ अभिव्यक्ति के लिए मिलान स्ट्रिंग का उदाहरण बदलें

8। regexp_split (स्ट्रिंग, पैटर्न)

दिए गए पैटर्न के लिए नियमित अभिव्यक्ति को विभाजित करता है

JSON के कार्य

निम्न तालिका JSON फ़ंक्शन को सूचीबद्ध करती है।

S.No कार्य और विवरण
1। json_array_contains (json, मान)

मान की जाँच करें एक json सरणी में मौजूद है। यदि मान मौजूद है, तो यह सही होगा, अन्यथा गलत

2। json_array_get (json_array, index)

Json array में इंडेक्स के लिए एलिमेंट प्राप्त करें

3। json_array_length (JSON)

Json सरणी में लंबाई लौटाता है

4। json_format (JSON)

जसन संरचना प्रारूप लौटाता है

5। json_parse (स्ट्रिंग)

एक जर्सन के रूप में स्ट्रिंग को पार्स करता है

6। json_size (json, json_path)

मान का आकार लौटाता है

URL कार्य

निम्न तालिका URL फ़ंक्शंस को सूचीबद्ध करती है।

S.No कार्य और विवरण
1। url_extract_host (यूआरएल)

URL का होस्ट लौटाता है

2। url_extract_path (यूआरएल)

URL का पथ लौटाता है

3। url_extract_port (यूआरएल)

URL का पोर्ट लौटाता है

4। url_extract_protocol (यूआरएल)

URL का प्रोटोकॉल लौटाता है

5। url_extract_query (यूआरएल)

URL की क्वेरी स्ट्रिंग लौटाता है

अलग कार्य

निम्नलिखित तालिका एग्रीगेट कार्यों को सूचीबद्ध करती है।

S.No कार्य और विवरण
1।

avg(x)

दिए गए मान के लिए औसत लौटाता है

2। मिनट (x, n)

दो मानों से न्यूनतम मान लौटाता है

3। अधिकतम (x, n)

दो मानों से अधिकतम मान लौटाता है

4। योग (एक्स)

मूल्य का योग लौटाता है

5। गिनती (*)

इनपुट पंक्तियों की संख्या लौटाता है

6। गिनती (एक्स)

इनपुट मानों की गिनती लौटाता है

7। चेकसम (एक्स)

के लिए चेकसम लौटाता है x

8। मनमाने ढंग से (एक्स)

के लिए मनमाना मूल्य लौटाता है x

रंग कार्य

निम्नलिखित तालिका रंग कार्यों को सूचीबद्ध करती है।

S.No कार्य और विवरण
1। बार (x, चौड़ाई)

आरजीबी लो_कोलर और हाई_कोलर का उपयोग करके एक बार को रेंडर करें

2। बार (x, चौड़ाई, low_color, high_color)

निर्दिष्ट चौड़ाई के लिए एकल बार रेंडर करें

3। रंग (स्ट्रिंग)

दर्ज किए गए स्ट्रिंग के लिए रंग मान लौटाता है

4। प्रस्तुत करना (x, रंग)

ANSI रंग कोड का उपयोग करके विशिष्ट रंग का उपयोग करके रेंडर वैल्यू x

5। प्रस्तुत करना (ख)

बूलियन मान को स्वीकार करता है और एएनएसआई रंग कोड का उपयोग करके एक हरे रंग का सच या एक लाल झूठा प्रदान करता है

6।

rgb(red, green, blue)

एक रंग मान लौटाता है जो 0 से 255 तक के अंतर पैरामीटर के रूप में दिए गए तीन घटक रंग मानों के RGB मान को कैप्चर करता है

ऐरे कार्य

निम्न तालिका सरणी कार्यों को सूचीबद्ध करती है।

S.No कार्य और विवरण
1। array_max (एक्स)

किसी सरणी में अधिकतम तत्व ढूँढता है

2। array_min (एक्स)

किसी सरणी में न्यूनतम तत्व ढूँढता है

3। array_sort (एक्स)

एक सरणी में तत्वों को सॉर्ट करता है

4। array_remove (एक्स, तत्व)

किसी सरणी से विशिष्ट तत्व निकालता है

5। concat (एक्स, वाई)

दो सरणियों को सम्‍मिलित करता है

6। शामिल (एक्स, तत्व)

दिए गए तत्वों को एक सरणी में ढूँढता है। अगर यह मौजूद है तो सच लौटा दिया जाएगा, अन्यथा झूठ

7। array_position (एक्स, तत्व)

किसी सरणी में दिए गए तत्व की स्थिति ज्ञात कीजिए

8। array_intersect (एक्स, वाई)

दो सरणियों के बीच एक प्रतिच्छेदन करता है

9। element_at (सरणी, इंडेक्स)

सरणी तत्व स्थिति देता है

10। टुकड़ा (एक्स, शुरू, लंबाई)

विशिष्ट लंबाई के साथ सरणी तत्वों को स्लाइस करता है

टेराडाटा कार्य

निम्न तालिका टेराडाटा कार्यों को सूचीबद्ध करती है।

S.No कार्य और विवरण
1। सूचकांक (स्ट्रिंग, स्ट्रिंग)

दिए गए विकल्प के साथ स्ट्रिंग का सूचकांक लौटाता है

2। सबस्ट्रिंग (स्ट्रिंग, शुरू)

दिए गए स्ट्रिंग के विकल्प को लौटाता है। आप यहां आरंभ सूचकांक को निर्दिष्ट कर सकते हैं

3। सबस्ट्रिंग (स्ट्रिंग, शुरू, लंबाई)

विशिष्ट स्टार्ट इंडेक्स और स्ट्रिंग की लंबाई के लिए दिए गए स्ट्रिंग के विकल्प को लौटाता है

MySQL कनेक्टर का उपयोग किसी बाहरी MySQL डेटाबेस को क्वेरी करने के लिए किया जाता है।

आवश्यक शर्तें

MySQL सर्वर इंस्टालेशन।

कॉन्फ़िगरेशन सेटिंग्स

उम्मीद है कि आपने mysql सर्वर को अपनी मशीन पर स्थापित किया होगा। Presto सर्वर पर mysql प्रॉपर्टीज़ को सक्षम करने के लिए, आपको एक फ़ाइल बनानी होगी“mysql.properties” में “etc/catalog”निर्देशिका। Mysql.properties फ़ाइल बनाने के लिए निम्न आदेश जारी करें।

$ cd etc $ cd catalog 
$ vi mysql.properties   

connector.name = mysql 
connection-url = jdbc:mysql://localhost:3306 
connection-user = root 
connection-password = pwd

फ़ाइल सहेजें और टर्मिनल से बाहर निकलें। उपरोक्त फ़ाइल में, आपको कनेक्शन-पासवर्ड फ़ील्ड में अपना mysql पासवर्ड दर्ज करना होगा।

MySQL सर्वर में डेटाबेस बनाएँ

MySQL सर्वर खोलें और निम्नलिखित कमांड का उपयोग करके एक डेटाबेस बनाएं।

create database tutorials

अब आपने सर्वर में "ट्यूटोरियल" डेटाबेस बनाया है। डेटाबेस प्रकार को सक्षम करने के लिए, क्वेरी विंडो में कमांड "उपयोग ट्यूटोरियल" का उपयोग करें।

तालिका बनाएं

चलो "ट्यूटोरियल" डेटाबेस पर एक सरल तालिका बनाते हैं।

create table author(auth_id int not null, auth_name varchar(50),topic varchar(100))

तलिका डालें

तालिका बनाने के बाद, निम्नलिखित क्वेरी का उपयोग करके तीन रिकॉर्ड डालें।

insert into author values(1,'Doug Cutting','Hadoop') 
insert into author values(2,’James Gosling','java') 
insert into author values(3,'Dennis Ritchie’,'C')

रिकॉर्ड का चयन करें

सभी रिकॉर्ड पुनर्प्राप्त करने के लिए, निम्न क्वेरी टाइप करें।

सवाल

select * from author

परिणाम

auth_id    auth_name      topic  
1        Doug Cutting     Hadoop 
2        James Gosling    java 
3        Dennis Ritchie     C

अब तक, आपने MySQL सर्वर का उपयोग करते हुए डेटा को क्वेर किया है। प्रेस्टो सर्वर पर मैसकल स्टोरेज प्लगइन कनेक्ट करते हैं।

कनेक्ट प्रेस्टो सीएलआई

Presto CLI पर MySql plugin को कनेक्ट करने के लिए निम्न कमांड टाइप करें।

./presto --server localhost:8080 --catalog mysql --schema tutorials

आपको निम्न प्रतिक्रिया प्राप्त होगी।

presto:tutorials>

यहाँ “tutorials” mysql सर्वर में स्कीमा को संदर्भित करता है।

योजनाओं को सूचीबद्ध करें

Mysql में सभी स्कीमाओं को सूचीबद्ध करने के लिए, प्रेस्टो सर्वर में निम्नलिखित क्वेरी टाइप करें।

सवाल

presto:tutorials> show schemas from mysql;

परिणाम

Schema 
-------------------- 
 information_schema 
 performance_schema 
 sys 
 tutorials

इस परिणाम से, हम पहले तीन स्कीमाओं को पूर्वनिर्धारित के रूप में समाप्त कर सकते हैं और अंतिम स्वयं के रूप में बनाया जा सकता है।

स्कीमा से सूची सूची

क्वेरी के बाद ट्यूटोरियल स्कीमा में सभी तालिकाओं को सूचीबद्ध करता है।

सवाल

presto:tutorials> show tables from mysql.tutorials;

परिणाम

Table 
-------- 
 author

हमने इस स्कीमा में केवल एक तालिका बनाई है। यदि आपने कई तालिकाएँ बनाई हैं, तो यह सभी तालिकाओं को सूचीबद्ध करेगी।

तालिका का वर्णन करें

तालिका फ़ील्ड का वर्णन करने के लिए, निम्न क्वेरी टाइप करें।

सवाल

presto:tutorials> describe mysql.tutorials.author;

परिणाम

Column   |     Type     | Comment 
-----------+--------------+--------- 
 auth_id   | integer      | 
 auth_name | varchar(50)  | 
 topic     | varchar(100) |

तालिका से कॉलम दिखाएं

सवाल

presto:tutorials> show columns from mysql.tutorials.author;

परिणाम

Column    |     Type     | Comment 
-----------+--------------+--------- 
 auth_id   | integer      | 
 auth_name | varchar(50)  | 
 topic     | varchar(100) |

एक्सेस टेबल रिकॉर्ड

Mysql तालिका से सभी रिकॉर्ड लाने के लिए, निम्नलिखित क्वेरी जारी करें।

सवाल

presto:tutorials> select * from mysql.tutorials.author;

परिणाम

auth_id  |   auth_name    | topic 
---------+----------------+-------- 
       1 | Doug Cutting   | Hadoop 
       2 | James Gosling  | java 
       3 | Dennis Ritchie | C

इस परिणाम से, आप प्रेस्टो में mysql सर्वर रिकॉर्ड प्राप्त कर सकते हैं।

कमांड के रूप में सारणी बनाएँ

Mysql कनेक्टर तालिका क्वेरी बनाने का समर्थन नहीं करता है, लेकिन आप कमांड के रूप में तालिका का उपयोग कर बना सकते हैं।

सवाल

presto:tutorials> create table mysql.tutorials.sample as 
select * from mysql.tutorials.author;

परिणाम

CREATE TABLE: 3 rows

आप सीधे पंक्तियों को सम्मिलित नहीं कर सकते क्योंकि इस कनेक्टर की कुछ सीमाएँ हैं। यह निम्नलिखित प्रश्नों का समर्थन नहीं कर सकता है -

  • create
  • insert
  • update
  • delete
  • drop

नए बनाए गए तालिका में रिकॉर्ड देखने के लिए, निम्न क्वेरी टाइप करें।

सवाल

presto:tutorials> select * from mysql.tutorials.sample;

परिणाम

auth_id  |   auth_name    | topic 
---------+----------------+-------- 
       1 | Doug Cutting   | Hadoop 
       2 | James Gosling  | java 
       3 | Dennis Ritchie | C

जावा मैनेजमेंट एक्सटेंशन्स (JMX) जावा वर्चुअल मशीन और JVM के अंदर चल रहे सॉफ्टवेयर के बारे में जानकारी देता है। JMX कनेक्टर का उपयोग Presto सर्वर में JMX जानकारी को क्वेरी करने के लिए किया जाता है।

जैसा कि हम पहले ही सक्षम कर चुके हैं “jmx.properties” के तहत दर्ज करें “etc/catalog”निर्देशिका। JMX प्लगइन को सक्षम करने के लिए अब Perst CLI को कनेक्ट करें।

प्रेस्टो सीएलआई

सवाल

$ ./presto --server localhost:8080 --catalog jmx --schema jmx

परिणाम

आपको निम्न प्रतिक्रिया प्राप्त होगी।

presto:jmx>

जेएमएक्स स्कीमा

"जेएमएक्स" में सभी स्कीमाओं को सूचीबद्ध करने के लिए, निम्नलिखित क्वेरी टाइप करें।

सवाल

presto:jmx> show schemas from jmx;

परिणाम

Schema 
-------------------- 
 information_schema  
 current

टेबल्स दिखाएँ

"वर्तमान" स्कीमा में तालिकाओं को देखने के लिए, निम्न कमांड का उपयोग करें।

प्रश्न 1

presto:jmx> show tables from jmx.current;

परिणाम

Table                   
------------------------------------------------------------------------------
 com.facebook.presto.execution.scheduler:name = nodescheduler
 com.facebook.presto.execution:name = queryexecution
 com.facebook.presto.execution:name = querymanager
 com.facebook.presto.execution:name = remotetaskfactory
 com.facebook.presto.execution:name = taskexecutor
 com.facebook.presto.execution:name = taskmanager
 com.facebook.presto.execution:type = queryqueue,name = global,expansion = global
 ………………
 ……………….

प्रश्न २

presto:jmx> select * from jmx.current.”java.lang:type = compilation";

परिणाम

node               | compilationtimemonitoringsupported |      name   |         objectname         | totalcompilationti
--------------------------------------+------------------------------------+--------------------------------+----------------------------+-------------------
ffffffff-ffff-ffff-ffff-ffffffffffff | true | HotSpot 64-Bit Tiered Compilers | java.lang:type=Compilation |       1276

प्रश्न ३

presto:jmx> select * from jmx.current."com.facebook.presto.server:name = taskresource";

परिणाम

node                 | readfromoutputbuffertime.alltime.count 
 | readfromoutputbuffertime.alltime.max | readfromoutputbuffertime.alltime.maxer
 --------------------------------------+---------------------------------------+--------------------------------------+--------------------------------------- 
 ffffffff-ffff-ffff-ffff-ffffffffffff |                                   92.0 |                          1.009106149 |

हाइव कनेक्टर एक हाइव डेटा वेयरहाउस में संग्रहीत डेटा को क्वेरी करने की अनुमति देता है।

आवश्यक शर्तें

  • Hadoop
  • Hive

उम्मीद है कि आपने Hadoop और Hive को अपनी मशीन पर स्थापित किया होगा। नए टर्मिनल में सभी सेवाएं एक-एक करके शुरू करें। फिर, निम्न आदेश का उपयोग करके हाइव मेटास्टोर शुरू करें,

hive --service metastore

प्रेस्टो हाइव तालिका के विवरण प्राप्त करने के लिए हाइव मेटास्टोर सेवा का उपयोग करता है।

कॉन्फ़िगरेशन सेटिंग्स

एक फ़ाइल बनाएँ “hive.properties” के अंतर्गत “etc/catalog”निर्देशिका। निम्न आदेश का उपयोग करें।

$ cd etc $ cd catalog 
$ vi hive.properties  

connector.name = hive-cdh4 
hive.metastore.uri = thrift://localhost:9083

सभी परिवर्तन करने के बाद, फ़ाइल को सहेजें और टर्मिनल को छोड़ दें।

डेटाबेस बनाएँ

निम्नलिखित क्वेरी का उपयोग करके हाइव में एक डेटाबेस बनाएं -

सवाल

hive> CREATE SCHEMA tutorials;

डेटाबेस बनने के बाद, आप इसका उपयोग करके सत्यापित कर सकते हैं “show databases” आदेश।

तालिका बनाएं

Create Table एक स्टेटमेंट है जिसका उपयोग Hive में टेबल बनाने के लिए किया जाता है। उदाहरण के लिए, निम्नलिखित क्वेरी का उपयोग करें।

hive> create table author(auth_id int, auth_name varchar(50), 
topic varchar(100) STORED AS SEQUENCEFILE;

तलिका डालें

हाइव की तालिका में रिकॉर्ड सम्मिलित करने के लिए निम्नलिखित क्वेरी का उपयोग किया जाता है।

hive> insert into table author values (1,’ Doug Cutting’,Hadoop),
(2,’ James Gosling’,java),(3,’ Dennis Ritchie’,C);

प्रेस्टो सीएलआई शुरू करें

आप निम्न आदेश का उपयोग करके हाइव भंडारण प्लगइन को जोड़ने के लिए प्रेस्टो सीएलआई शुरू कर सकते हैं।

$ ./presto --server localhost:8080 --catalog hive —schema tutorials;

आपको निम्न प्रतिक्रिया प्राप्त होगी।

presto:tutorials >

योजनाओं को सूचीबद्ध करें

हाइव कनेक्टर में सभी स्कीमाओं को सूचीबद्ध करने के लिए, निम्न कमांड टाइप करें।

सवाल

presto:tutorials > show schemas from hive;

परिणाम

default  

tutorials

सूची सारणी

"ट्यूटोरियल" स्कीमा में सभी तालिकाओं को सूचीबद्ध करने के लिए, निम्नलिखित क्वेरी का उपयोग करें।

सवाल

presto:tutorials > show tables from hive.tutorials;

परिणाम

author

फ़ेच टेबल

हाइव की तालिका से सभी रिकॉर्ड प्राप्त करने के लिए निम्नलिखित क्वेरी का उपयोग किया जाता है।

सवाल

presto:tutorials > select * from hive.tutorials.author;

परिणाम

auth_id  |   auth_name    | topic 
---------+----------------+-------- 
       1 | Doug Cutting   | Hadoop 
       2 | James Gosling  | java 
       3 | Dennis Ritchie | C

प्रेस्टो के लिए काफ्का कनेक्टर प्रेस्टो का उपयोग करके अपाचे काफ्का से डेटा का उपयोग करने की अनुमति देता है।

आवश्यक शर्तें

निम्नलिखित अपाचे परियोजनाओं के नवीनतम संस्करण को डाउनलोड और इंस्टॉल करें।

  • अपाचे चिड़ियाघर कीपर
  • अपाचे काफ्का

ZooKeeper प्रारंभ करें

निम्न कमांड का उपयोग करके ZooKeeper सर्वर शुरू करें।

$ bin/zookeeper-server-start.sh config/zookeeper.properties

अब, ज़ूकीपर 2181 में पोर्ट शुरू करता है।

काफ्का शुरू करें

निम्न आदेश का उपयोग करके दूसरे टर्मिनल में काफ्का प्रारंभ करें।

$ bin/kafka-server-start.sh config/server.properties

काफ्का शुरू होने के बाद, यह पोर्ट नंबर 9092 का उपयोग करता है।

TPCH डेटा

Tpch-kafka डाउनलोड करें

$  curl -o kafka-tpch 
https://repo1.maven.org/maven2/de/softwareforge/kafka_tpch_0811/1.0/kafka_tpch_ 
0811-1.0.sh

अब आपने उपरोक्त कमांड का उपयोग करके लोडर को मावेन सेंट्रल से डाउनलोड किया है। आपको निम्नलिखित के समान प्रतिक्रिया मिलेगी।

% Total    % Received % Xferd  Average Speed   Time    Time     Time  Current 
                                 Dload  Upload   Total   Spent    Left  Speed 
  0     0    0     0    0     0      0      0 --:--:--  0:00:01 --:--:--     0  
  5 21.6M    5 1279k    0     0  83898      0  0:04:30  0:00:15  0:04:15  129k
  6 21.6M    6 1407k    0     0  86656      0  0:04:21  0:00:16  0:04:05  131k  
 24 21.6M   24 5439k    0     0   124k      0  0:02:57  0:00:43  0:02:14  175k 
 24 21.6M   24 5439k    0     0   124k      0  0:02:58  0:00:43  0:02:15  160k 
 25 21.6M   25 5736k    0     0   128k      0  0:02:52  0:00:44  0:02:08  181k 
 ………………………..

फिर, निम्नलिखित कमांड का उपयोग करके इसे निष्पादन योग्य बनाएं,

$ chmod 755 kafka-tpch

Tpch-kafka चलाएं

निम्नलिखित कमांड का उपयोग करके tchch डेटा के साथ कई विषयों को प्रीलोड करने के लिए kafka-tpch प्रोग्राम चलाएं।

सवाल

$ ./kafka-tpch load --brokers localhost:9092 --prefix tpch. --tpch-type tiny

परिणाम

2016-07-13T16:15:52.083+0530 INFO main io.airlift.log.Logging Logging 
to stderr
2016-07-13T16:15:52.124+0530 INFO main de.softwareforge.kafka.LoadCommand
Processing tables: [customer, orders, lineitem, part, partsupp, supplier,
nation, region]
2016-07-13T16:15:52.834+0530 INFO pool-1-thread-1
de.softwareforge.kafka.LoadCommand Loading table 'customer' into topic 'tpch.customer'...
2016-07-13T16:15:52.834+0530 INFO pool-1-thread-2
de.softwareforge.kafka.LoadCommand Loading table 'orders' into topic 'tpch.orders'...
2016-07-13T16:15:52.834+0530 INFO pool-1-thread-3
de.softwareforge.kafka.LoadCommand Loading table 'lineitem' into topic 'tpch.lineitem'...
2016-07-13T16:15:52.834+0530 INFO pool-1-thread-4
de.softwareforge.kafka.LoadCommand Loading table 'part' into topic 'tpch.part'...
………………………
……………………….

अब, काफ्का तालिकाओं के ग्राहक, ऑर्डर, सप्लायर आदि को tpch का उपयोग करके लोड किया जाता है।

कॉन्फ़िगरेशन सेटिंग्स जोड़ें

आइए Presto सर्वर पर निम्न काफ्का कनेक्टर कॉन्फ़िगरेशन सेटिंग्स जोड़ें।

connector.name = kafka  

kafka.nodes = localhost:9092  

kafka.table-names = tpch.customer,tpch.orders,tpch.lineitem,tpch.part,tpch.partsupp, 
tpch.supplier,tpch.nation,tpch.region  

kafka.hide-internal-columns = false

उपरोक्त कॉन्फ़िगरेशन में, काफ्का-टेबल प्रोग्राम का उपयोग करके काफ्का तालिकाओं को लोड किया जाता है।

प्रेस्टो सीएलआई शुरू करें

निम्नलिखित कमांड का उपयोग करके प्रेस्टो सीएलआई शुरू करें,

$ ./presto --server localhost:8080 --catalog kafka —schema tpch;

यहाँ “tpch" काफ्का कनेक्टर के लिए एक स्कीमा है और आपको निम्न के रूप में एक प्रतिक्रिया प्राप्त होगी।

presto:tpch>

सूची सारणी

निम्नलिखित क्वेरी में सभी तालिकाओं को सूचीबद्ध किया गया है “tpch” स्कीमा।

सवाल

presto:tpch> show tables;

परिणाम

Table 
---------- 
 customer 
 lineitem 
 nation 
 orders
 part 
 partsupp 
 region 
 supplier

ग्राहक तालिका का वर्णन करें

निम्नलिखित क्वेरी का वर्णन करता है “customer” तालिका।

सवाल

presto:tpch> describe customer;

परिणाम

Column           |  Type   |                   Comment 
-------------------+---------+--------------------------------------------- 
 _partition_id     | bigint  | Partition Id 
 _partition_offset | bigint  | Offset for the message within the partition 
 _segment_start    | bigint  | Segment start offset 
 _segment_end      | bigint  | Segment end offset 
 _segment_count    | bigint  | Running message count per segment 
 _key              | varchar | Key text 
 _key_corrupt      | boolean | Key data is corrupt 
 _key_length       | bigint  | Total number of key bytes 
 _message          | varchar | Message text 
 _message_corrupt  | boolean | Message data is corrupt 
 _message_length   | bigint  | Total number of message bytes

जावा एप्लिकेशन को एक्सेस करने के लिए प्रेस्टो के JDBC इंटरफ़ेस का उपयोग किया जाता है।

आवश्यक शर्तें

प्रीस्टो-जेडडीबीसी-0.150.जर स्थापित करें

आप निम्न लिंक पर जाकर JDBC जार फ़ाइल डाउनलोड कर सकते हैं,

https://repo1.maven.org/maven2/com/facebook/presto/presto-jdbc/0.150/

जार फ़ाइल डाउनलोड होने के बाद, इसे अपने जावा एप्लिकेशन के वर्ग पथ में जोड़ें।

एक सरल अनुप्रयोग बनाएँ

चलो JDBC इंटरफ़ेस का उपयोग करके एक साधारण जावा एप्लिकेशन बनाएं।

कोडिंग - PrestoJdbcSample.java

import java.sql.*; 
import com.facebook.presto.jdbc.PrestoDriver; 

//import presto jdbc driver packages here.  
public class PrestoJdbcSample {  
   public static void main(String[] args) {  
      Connection connection = null; 
      Statement statement = null;  
      try { 
         
         Class.forName("com.facebook.presto.jdbc.PrestoDriver");  
         connection = DriverManager.getConnection(
         "jdbc:presto://localhost:8080/mysql/tutorials", "tutorials", “"); 
         
         //connect mysql server tutorials database here 
         statement = connection.createStatement(); 
         String sql;  
         sql = "select auth_id, auth_name from mysql.tutorials.author”; 
        
         //select mysql table author table two columns  
         ResultSet resultSet = statement.executeQuery(sql);  
         while(resultSet.next()){  
            int id  = resultSet.getInt("auth_id"); 
            String name = resultSet.getString(“auth_name");  
            System.out.print("ID: " + id + ";\nName: " + name + "\n"); 
         }  
         
         resultSet.close(); 
         statement.close(); 
         connection.close(); 
         
      }catch(SQLException sqlException){ 
         sqlException.printStackTrace(); 
      }catch(Exception exception){ 
         exception.printStackTrace(); 
      } 
   } 
}

फ़ाइल सहेजें और एप्लिकेशन को छोड़ दें। अब, एक टर्मिनल में प्रेस्टो सर्वर शुरू करें और परिणाम को संकलित करने और निष्पादित करने के लिए एक नया टर्मिनल खोलें। निम्नलिखित चरण हैं -

संकलन

~/Workspace/presto/presto-jdbc $ javac -cp presto-jdbc-0.149.jar  PrestoJdbcSample.java

क्रियान्वयन

~/Workspace/presto/presto-jdbc $ java -cp .:presto-jdbc-0.149.jar  PrestoJdbcSample

उत्पादन

INFO: Logging initialized @146ms  
ID: 1; 
Name: Doug Cutting 
ID: 2; 
Name: James Gosling 
ID: 3; 
Name: Dennis Ritchie

प्रेस्टो कस्टम फ़ंक्शन को विकसित करने के लिए एक मैवेन प्रोजेक्ट बनाएं।

SimpleFunctionsFactory.java

फ़ंक्शन को लागू करने के लिए SimpleFunctionsFactory क्लास बनाएँ।

package com.tutorialspoint.simple.functions;  

import com.facebook.presto.metadata.FunctionFactory; 
import com.facebook.presto.metadata.FunctionListBuilder; 
import com.facebook.presto.metadata.SqlFunction; 
import com.facebook.presto.spi.type.TypeManager;  
import java.util.List;  

public class SimpleFunctionFactory implements FunctionFactory { 
   
   private final TypeManager typeManager;  
   public SimpleFunctionFactory(TypeManager typeManager) { 
      this.typeManager = typeManager; 
   }  
    @Override 
    
   public List<SqlFunction> listFunctions() { 
      return new FunctionListBuilder(typeManager) 
      .scalar(SimpleFunctions.class) 
      .getFunctions(); 
   } 
}

SimpleFunctionsPlugin.java

प्लगइन इंटरफेस को लागू करने के लिए एक SimpleFunctionsPlugin वर्ग बनाएँ।

package com.tutorialspoint.simple.functions;  

import com.facebook.presto.metadata.FunctionFactory; 
import com.facebook.presto.spi.Plugin; 
import com.facebook.presto.spi.type.TypeManager; 
import com.google.common.collect.ImmutableList;  
import javax.inject.Inject; 
import java.util.List; 
import static java.util.Objects.requireNonNull;  

public class SimpleFunctionsPlugin implements Plugin {  
   private TypeManager typeManager; 
   @Inject 
   
   public void setTypeManager(TypeManager typeManager) { 
      this.typeManager = requireNonNull(typeManager, "typeManager is null”); 
      //Inject TypeManager class here 
   }  
   @Override 
   
   public <T> List<T> getServices(Class<T> type){ 
      if (type == FunctionFactory.class) { 
         return ImmutableList.of(type.cast(new SimpleFunctionFactory(typeManager))); 
      } 
      return ImmutableList.of(); 
   } 
}

संसाधन फ़ाइल जोड़ें

एक संसाधन फ़ाइल बनाएँ जो कार्यान्वयन पैकेज में निर्दिष्ट है।

(com.tutorialspoint.simple.functions.SimpleFunctionsPlugin)

अब संसाधन फ़ाइल स्थान @ / पथ / से / संसाधन / पर जाएं

फिर परिवर्तन जोड़ें,

com.facebook.presto.spi.Plugin

pom.xml

Pom.xml फ़ाइल के लिए निम्न निर्भरताएँ जोड़ें।

<?xml version = "1.0"?> 
<project xmlns = "http://maven.apache.org/POM/4.0.0"  
 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"  
 xsi:schemaLocation = "http://maven.apache.org/POM/4.0.0  
    http://maven.apache.org/xsd/maven-4.0.0.xsd">  
   
   <modelVersion>4.0.0</modelVersion> 
   <groupId>com.tutorialspoint.simple.functions</groupId> 
   <artifactId>presto-simple-functions</artifactId>  
   <packaging>jar</packaging>  
   <version>1.0</version>
   <name>presto-simple-functions</name>
   <description>Simple test functions for Presto</description> 
   <properties> 
      <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
   </properties>  
   <dependencies> 
      <dependency> 
         <groupId>com.facebook.presto</groupId> 
         <artifactId>presto-spi</artifactId>
         <version>0.149</version> 
      </dependency>  
      <dependency> 
         <groupId>com.facebook.presto</groupId> 
         <artifactId>presto-main</artifactId> 
         <version>0.149</version> 
      </dependency>  
      <dependency> 
         <groupId>javax.inject</groupId> 
         <artifactId>javax.inject</artifactId> 
         <version>1</version> 
      </dependency>  
      <dependency> 
         <groupId>com.google.guava</groupId> 
         <artifactId>guava</artifactId> 
         <version>19.0</version> 
      </dependency> 
   </dependencies>  
   <build> 
      <finalName>presto-simple-functions</finalName>  
      <plugins>  
      <!-- Make this jar executable --> 
         <plugin> 
            <groupId>org.apache.maven.plugins</groupId> 
            <artifactId>maven-jar-plugin</artifactId> 
            <version>2.3.2</version> 
         </plugin> 
      </plugins> 
   </build> 
</project>

SimpleFunctions.java

Presto विशेषताओं का उपयोग करके SimpleFunctions वर्ग बनाएं।

package com.tutorialspoint.simple.functions;  

import com.facebook.presto.operator.Description; 
import com.facebook.presto.operator.scalar.ScalarFunction; 
import com.facebook.presto.operator.scalar.StringFunctions; 
import com.facebook.presto.spi.type.StandardTypes; 
import com.facebook.presto.type.LiteralParameters; 
import com.facebook.presto.type.SqlType;  

public final class SimpleFunctions { 
   private SimpleFunctions() { 
   }  
    
   @Description("Returns summation of two numbers") 
   @ScalarFunction(“mysum") 
   //function name 
   @SqlType(StandardTypes.BIGINT) 
    
   public static long sum(@SqlType(StandardTypes.BIGINT) long num1, 
   @SqlType(StandardTypes.BIGINT) long num2) { 
      return num1 + num2; 
   } 
}

एप्लिकेशन को कंपाइल करने और एप्लिकेशन को निष्पादित करने के बाद बनाया जाता है। यह JAR फ़ाइल का उत्पादन करेगा। फ़ाइल को कॉपी करें और JAR फ़ाइल को लक्ष्य प्रेस्टो सर्वर प्लगइन निर्देशिका में स्थानांतरित करें।

संकलन

mvn compile

क्रियान्वयन

mvn package

अब प्रेस्टो सर्वर को रीस्टार्ट करें और प्रेस्टो क्लाइंट को कनेक्ट करें। फिर नीचे बताए अनुसार कस्टम फंक्शन एप्लिकेशन को निष्पादित करें,

$ ./presto --catalog mysql --schema default

सवाल

presto:default> select mysum(10,10);

परिणाम

_col0  
------- 
  20