Apache Pig - डायग्नोस्टिक ऑपरेटर्स
loadकथन केवल Apache Pig में निर्दिष्ट संबंध में डेटा लोड करेगा। के निष्पादन को सत्यापित करने के लिएLoad बयान, आप का उपयोग करने के लिए है Diagnostic Operators। सुअर लैटिन नैदानिक ऑपरेटरों के चार अलग-अलग प्रकार प्रदान करता है -
- डंप संचालक
- ऑपरेटर का वर्णन करें
- स्पष्टीकरण ऑपरेटर
- चित्रण संचालक
इस अध्याय में, हम सुअर लैटिन के डंप ऑपरेटरों पर चर्चा करेंगे।
डंप संचालक
Dumpपिग लैटिन स्टेटमेंट को चलाने और स्क्रीन पर परिणाम प्रदर्शित करने के लिए ऑपरेटर का उपयोग किया जाता है। यह आमतौर पर उद्देश्य डिबगिंग के लिए प्रयोग किया जाता है।
वाक्य - विन्यास
नीचे दिए गए का सिंटैक्स है Dump ऑपरेटर।
grunt> Dump Relation_Name
उदाहरण
मान लें कि हमारे पास एक फ़ाइल है student_data.txt एचडीएफएस निम्नलिखित सामग्री के साथ।
001,Rajiv,Reddy,9848022337,Hyderabad
002,siddarth,Battacharya,9848022338,Kolkata
003,Rajesh,Khanna,9848022339,Delhi
004,Preethi,Agarwal,9848022330,Pune
005,Trupthi,Mohanthy,9848022336,Bhuwaneshwar
006,Archana,Mishra,9848022335,Chennai.
और हमने इसे एक रिलेशन में पढ़ा है student नीचे दिखाए अनुसार LOAD ऑपरेटर का उपयोग करना।
grunt> student = LOAD 'hdfs://localhost:9000/pig_data/student_data.txt'
USING PigStorage(',')
as ( id:int, firstname:chararray, lastname:chararray, phone:chararray,
city:chararray );
अब, '' का उपयोग करके 'रिलेशन' की सामग्री को प्रिंट करते हैं Dump operator जैसा की नीचे दिखाया गया।
grunt> Dump student
एक बार जब आप ऊपर निष्पादित करते हैं Pig Latinबयान, यह HDFS से डेटा पढ़ने के लिए MapReduce का काम शुरू करेगा। यह निम्न आउटपुट का उत्पादन करेगा।
2015-10-01 15:05:27,642 [main]
INFO org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLauncher -
100% complete
2015-10-01 15:05:27,652 [main]
INFO org.apache.pig.tools.pigstats.mapreduce.SimplePigStats - Script Statistics:
HadoopVersion PigVersion UserId StartedAt FinishedAt Features
2.6.0 0.15.0 Hadoop 2015-10-01 15:03:11 2015-10-01 05:27 UNKNOWN
Success!
Job Stats (time in seconds):
JobId job_14459_0004
Maps 1
Reduces 0
MaxMapTime n/a
MinMapTime n/a
AvgMapTime n/a
MedianMapTime n/a
MaxReduceTime 0
MinReduceTime 0
AvgReduceTime 0
MedianReducetime 0
Alias student
Feature MAP_ONLY
Outputs hdfs://localhost:9000/tmp/temp580182027/tmp757878456,
Input(s): Successfully read 0 records from: "hdfs://localhost:9000/pig_data/
student_data.txt"
Output(s): Successfully stored 0 records in: "hdfs://localhost:9000/tmp/temp580182027/
tmp757878456"
Counters: Total records written : 0 Total bytes written : 0 Spillable Memory Manager
spill count : 0Total bags proactively spilled: 0 Total records proactively spilled: 0
Job DAG: job_1443519499159_0004
2015-10-01 15:06:28,403 [main]
INFO org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLau ncher - Success!
2015-10-01 15:06:28,441 [main] INFO org.apache.pig.data.SchemaTupleBackend -
Key [pig.schematuple] was not set... will not generate code.
2015-10-01 15:06:28,485 [main]
INFO org.apache.hadoop.mapreduce.lib.input.FileInputFormat - Total input paths
to process : 1
2015-10-01 15:06:28,485 [main]
INFO org.apache.pig.backend.hadoop.executionengine.util.MapRedUtil - Total input paths
to process : 1
(1,Rajiv,Reddy,9848022337,Hyderabad) (2,siddarth,Battacharya,9848022338,Kolkata) (3,Rajesh,Khanna,9848022339,Delhi) (4,Preethi,Agarwal,9848022330,Pune) (5,Trupthi,Mohanthy,9848022336,Bhuwaneshwar) (6,Archana,Mishra,9848022335,Chennai)