अपाचे सुअर - ग्रंट शेल
ग्रंट शेल को लागू करने के बाद, आप शेल में अपनी पिग स्क्रिप्ट चला सकते हैं। इसके अतिरिक्त, ग्रंट शेल द्वारा प्रदान की जाने वाली कुछ उपयोगी शेल और उपयोगिता कमांड हैं। यह अध्याय ग्रंट शेल द्वारा प्रदान किए गए शेल और उपयोगिता कमांड की व्याख्या करता है।
Note - इस अध्याय के कुछ भागों में, जैसे आदेश Load तथा Storeउपयोग किया जाता है। उन पर विस्तार से जानकारी प्राप्त करने के लिए संबंधित अध्यायों का संदर्भ लें।
शेल कमांड्स
Apache Pig के ग्रंट शेल का उपयोग मुख्य रूप से Pig Latin लिपियों को लिखने के लिए किया जाता है। उससे पहले, हम किसी भी शेल कमांड का उपयोग कर सकते हैंsh तथा fs।
श कमान
का उपयोग करते हुए shकमांड, हम ग्रन्ट शेल से किसी भी शेल कमांड को इनवाइट कर सकते हैं। का उपयोग करते हुएsh ग्रंट शेल से कमांड, हम उन कमांड को निष्पादित नहीं कर सकते हैं जो शेल वातावरण का एक हिस्सा हैं (ex - सीडी)।
Syntax
नीचे दिए गए का सिंटैक्स है sh आदेश।
grunt> sh shell command parameters
Example
हम आह्वान कर सकते हैं ls का उपयोग कर ग्रन्ट शेल से लिनक्स शेल की कमान shविकल्प के रूप में नीचे दिखाया गया है। इस उदाहरण में, यह फ़ाइलों को सूची बद्ध करता है/pig/bin/ निर्देशिका।
grunt> sh ls
pig
pig_1444799121955.log
pig.cmd
pig.py
fs कमांड
का उपयोग करते हुए fs कमांड, हम ग्रन्ट शेल से किसी भी FsShell कमांड को लागू कर सकते हैं।
Syntax
नीचे दिए गए का सिंटैक्स है fs आदेश।
grunt> sh File System command parameters
Example
हम fs कमांड का उपयोग करके ग्रंट शेल से एचडीएफएस के ls कमांड को लागू कर सकते हैं। निम्नलिखित उदाहरण में, यह एचडीएफएस रूट डायरेक्टरी में फाइलों को सूचीबद्ध करता है।
grunt> fs –ls
Found 3 items
drwxrwxrwx - Hadoop supergroup 0 2015-09-08 14:13 Hbase
drwxr-xr-x - Hadoop supergroup 0 2015-09-09 14:52 seqgen_data
drwxr-xr-x - Hadoop supergroup 0 2015-09-08 11:30 twitter_data
उसी तरह, हम ग्रंट शेल से अन्य सभी फ़ाइल सिस्टम शेल कमांड का उपयोग करके इनवॉइस कर सकते हैं fs आदेश।
यूटिलिटी कमांड्स
ग्रंट शेल उपयोगिता कमांड का एक सेट प्रदान करता है। इनमें उपयोगिता कमांड जैसे शामिल हैंclear, help, history, quit, तथा set; और जैसे आदेशexec, kill, तथा runग्रन्ट शेल से सुअर को नियंत्रित करने के लिए। नीचे दिए गए ग्रंट शेल द्वारा प्रदान की गई उपयोगिता कमांड का वर्णन है।
स्पष्ट कमान
clear ग्रंट शेल की स्क्रीन को साफ करने के लिए कमांड का उपयोग किया जाता है।
Syntax
आप का उपयोग करके ग्रन्ट शेल की स्क्रीन को साफ कर सकते हैं clear जैसा कि नीचे दिखाया गया है।
grunt> clear
कमांड की मदद करें
help कमांड आपको पिग कमांड या पिग प्रॉपर्टीज की एक सूची देता है।
Usage
आप का उपयोग कर सुअर आदेशों की एक सूची प्राप्त कर सकते हैं help जैसा कि नीचे दिखाया गया है।
grunt> help
Commands: <pig latin statement>; - See the PigLatin manual for details:
http://hadoop.apache.org/pig
File system commands:fs <fs arguments> - Equivalent to Hadoop dfs command:
http://hadoop.apache.org/common/docs/current/hdfs_shell.html
Diagnostic Commands:describe <alias>[::<alias] - Show the schema for the alias.
Inner aliases can be described as A::B.
explain [-script <pigscript>] [-out <path>] [-brief] [-dot|-xml]
[-param <param_name>=<pCram_value>]
[-param_file <file_name>] [<alias>] -
Show the execution plan to compute the alias or for entire script.
-script - Explain the entire script.
-out - Store the output into directory rather than print to stdout.
-brief - Don't expand nested plans (presenting a smaller graph for overview).
-dot - Generate the output in .dot format. Default is text format.
-xml - Generate the output in .xml format. Default is text format.
-param <param_name - See parameter substitution for details.
-param_file <file_name> - See parameter substitution for details.
alias - Alias to explain.
dump <alias> - Compute the alias and writes the results to stdout.
Utility Commands: exec [-param <param_name>=param_value] [-param_file <file_name>] <script> -
Execute the script with access to grunt environment including aliases.
-param <param_name - See parameter substitution for details.
-param_file <file_name> - See parameter substitution for details.
script - Script to be executed.
run [-param <param_name>=param_value] [-param_file <file_name>] <script> -
Execute the script with access to grunt environment.
-param <param_name - See parameter substitution for details.
-param_file <file_name> - See parameter substitution for details.
script - Script to be executed.
sh <shell command> - Invoke a shell command.
kill <job_id> - Kill the hadoop job specified by the hadoop job id.
set <key> <value> - Provide execution parameters to Pig. Keys and values are case sensitive.
The following keys are supported:
default_parallel - Script-level reduce parallelism. Basic input size heuristics used
by default.
debug - Set debug on or off. Default is off.
job.name - Single-quoted name for jobs. Default is PigLatin:<script name>
job.priority - Priority for jobs. Values: very_low, low, normal, high, very_high.
Default is normal stream.skippath - String that contains the path.
This is used by streaming any hadoop property.
help - Display this message.
history [-n] - Display the list statements in cache.
-n Hide line numbers.
quit - Quit the grunt shell.
इतिहास कमान
यह कमांड ग्रंट बेचने के बाद से अब तक निष्पादित / उपयोग किए गए बयानों की एक सूची प्रदर्शित करता है।
Usage
मान लें कि हमने ग्रंट शेल खोलने के बाद से तीन बयानों को निष्पादित किया है।
grunt> customers = LOAD 'hdfs://localhost:9000/pig_data/customers.txt' USING PigStorage(',');
grunt> orders = LOAD 'hdfs://localhost:9000/pig_data/orders.txt' USING PigStorage(',');
grunt> student = LOAD 'hdfs://localhost:9000/pig_data/student.txt' USING PigStorage(',');
फिर, का उपयोग कर history कमांड निम्न आउटपुट का उत्पादन करेगा।
grunt> history
customers = LOAD 'hdfs://localhost:9000/pig_data/customers.txt' USING PigStorage(',');
orders = LOAD 'hdfs://localhost:9000/pig_data/orders.txt' USING PigStorage(',');
student = LOAD 'hdfs://localhost:9000/pig_data/student.txt' USING PigStorage(',');
कमांड सेट करें
set सुअर में उपयोग की जाने वाली चाबियों को मान दिखाने / असाइन करने के लिए कमांड का उपयोग किया जाता है।
Usage
इस कमांड का उपयोग करके, आप निम्न कुंजियों पर मान सेट कर सकते हैं।
चाभी | विवरण और मूल्य |
---|---|
default_parallel | आप इस कुंजी के मान के रूप में किसी भी पूरी संख्या को पास करके मानचित्र नौकरी के लिए रिड्यूसर की संख्या निर्धारित कर सकते हैं। |
debug | आप इस कुंजी को चालू / बंद करके सुअर में डीबगिंग के खतरे को बंद या चालू कर सकते हैं। |
job.name | आप इस कुंजी को एक स्ट्रिंग मान पास करके नौकरी का नाम आवश्यक कार्य पर सेट कर सकते हैं। |
job.priority | आप इस कुंजी में निम्नलिखित में से किसी एक मान को पास करके नौकरी की प्राथमिकता तय कर सकते हैं -
|
stream.skippath | स्ट्रीमिंग के लिए, आप उस पथ को सेट कर सकते हैं जहां से डेटा को स्थानांतरित नहीं करना है, इस कुंजी के लिए स्ट्रिंग के रूप में वांछित पथ को पास करके। |
आज्ञा छोड़ो
आप इस आदेश का उपयोग करके ग्रंट शेल से बाहर निकल सकते हैं।
Usage
नीचे दिखाए अनुसार ग्रन्ट शेल से बाहर निकलें।
grunt> quit
आइए अब हम उन कमांडों पर एक नज़र डालते हैं जिनके उपयोग से आप ग्रंट शेल से अपाचे सुअर को नियंत्रित कर सकते हैं।
निष्पादित करें
का उपयोग करते हुए exec कमांड, हम पिग स्क्रिप्ट को ग्रंट शेल से निष्पादित कर सकते हैं।
Syntax
नीचे दिए गए उपयोगिता कमांड का सिंटैक्स है exec।
grunt> exec [–param param_name = param_value] [–param_file file_name] [script]
Example
चलिए मान लेते हैं कि एक फाइल है जिसका नाम है student.txt में /pig_data/ निम्नलिखित सामग्री के साथ HDFS की निर्देशिका।
Student.txt
001,Rajiv,Hyderabad
002,siddarth,Kolkata
003,Rajesh,Delhi
और, मान लें कि हमारे पास एक स्क्रिप्ट फ़ाइल है जिसका नाम है sample_script.pig में /pig_data/ निम्नलिखित सामग्री के साथ HDFS की निर्देशिका।
Sample_script.pig
student = LOAD 'hdfs://localhost:9000/pig_data/student.txt' USING PigStorage(',')
as (id:int,name:chararray,city:chararray);
Dump student;
अब, ग्रन्ट शेल से उपरोक्त स्क्रिप्ट को निष्पादित करते हैं exec जैसा कि नीचे दिखाया गया है।
grunt> exec /sample_script.pig
Output
exec कमांड स्क्रिप्ट को निष्पादित करता है sample_script.pig। जैसा कि स्क्रिप्ट में निर्देशित है, यह लोड करता हैstudent.txt पिग में फ़ाइल करें और आपको निम्न सामग्री प्रदर्शित करने वाले डंप ऑपरेटर का परिणाम देता है।
(1,Rajiv,Hyderabad)
(2,siddarth,Kolkata)
(3,Rajesh,Delhi)
मार डालो कमान
आप इस आदेश का उपयोग करके ग्रंट शेल से नौकरी मार सकते हैं।
Syntax
नीचे दिए गए का सिंटैक्स है kill आदेश।
grunt> kill JobId
Example
मान लीजिए कि आईडी चल रहा है Id_0055, आप इसे का उपयोग करके ग्रन्ट शेल से मार सकते हैं kill कमांड, जैसा कि नीचे दिखाया गया है।
grunt> kill Id_0055
चलाने के आदेश
आप का उपयोग करके ग्रन्ट शेल से एक सुअर स्क्रिप्ट चला सकते हैं run आदेश
Syntax
नीचे दिए गए का सिंटैक्स है run आदेश।
grunt> run [–param param_name = param_value] [–param_file file_name] script
Example
चलिए मान लेते हैं कि एक फाइल है जिसका नाम है student.txt में /pig_data/ निम्नलिखित सामग्री के साथ HDFS की निर्देशिका।
Student.txt
001,Rajiv,Hyderabad
002,siddarth,Kolkata
003,Rajesh,Delhi
और, मान लें कि हमारे पास एक स्क्रिप्ट फ़ाइल है जिसका नाम है sample_script.pig निम्नलिखित सामग्री के साथ स्थानीय फाइल सिस्टम में।
Sample_script.pig
student = LOAD 'hdfs://localhost:9000/pig_data/student.txt' USING
PigStorage(',') as (id:int,name:chararray,city:chararray);
अब, नीचे दिए गए अनुसार रन कमांड का उपयोग करके ग्रंट शेल से उपरोक्त स्क्रिप्ट को रन करें।
grunt> run /sample_script.pig
आप स्क्रिप्ट का आउटपुट देख सकते हैं Dump operator जैसा की नीचे दिखाया गया।
grunt> Dump;
(1,Rajiv,Hyderabad)
(2,siddarth,Kolkata)
(3,Rajesh,Delhi)
Note - के बीच का अंतर exec और यह run कमांड यह है कि यदि हम उपयोग करते हैं runस्क्रिप्ट से दिए गए कथन कमांड इतिहास में उपलब्ध हैं।