Apache Pig - डायग्नोस्टिक ऑपरेटर्स

loadकथन केवल Apache Pig में निर्दिष्ट संबंध में डेटा लोड करेगा। के निष्पादन को सत्यापित करने के लिएLoad बयान, आप का उपयोग करने के लिए है Diagnostic Operators। सुअर लैटिन नैदानिक ​​ऑपरेटरों के चार अलग-अलग प्रकार प्रदान करता है -

  • डंप संचालक
  • ऑपरेटर का वर्णन करें
  • स्पष्टीकरण ऑपरेटर
  • चित्रण संचालक

इस अध्याय में, हम सुअर लैटिन के डंप ऑपरेटरों पर चर्चा करेंगे।

डंप संचालक

Dumpपिग लैटिन स्टेटमेंट को चलाने और स्क्रीन पर परिणाम प्रदर्शित करने के लिए ऑपरेटर का उपयोग किया जाता है। यह आमतौर पर उद्देश्य डिबगिंग के लिए प्रयोग किया जाता है।

वाक्य - विन्यास

नीचे दिए गए का सिंटैक्स है Dump ऑपरेटर।

grunt> Dump Relation_Name

उदाहरण

मान लें कि हमारे पास एक फ़ाइल है student_data.txt एचडीएफएस निम्नलिखित सामग्री के साथ।

001,Rajiv,Reddy,9848022337,Hyderabad
002,siddarth,Battacharya,9848022338,Kolkata
003,Rajesh,Khanna,9848022339,Delhi
004,Preethi,Agarwal,9848022330,Pune
005,Trupthi,Mohanthy,9848022336,Bhuwaneshwar
006,Archana,Mishra,9848022335,Chennai.

और हमने इसे एक रिलेशन में पढ़ा है student नीचे दिखाए अनुसार LOAD ऑपरेटर का उपयोग करना।

grunt> student = LOAD 'hdfs://localhost:9000/pig_data/student_data.txt' 
   USING PigStorage(',')
   as ( id:int, firstname:chararray, lastname:chararray, phone:chararray, 
   city:chararray );

अब, '' का उपयोग करके 'रिलेशन' की सामग्री को प्रिंट करते हैं Dump operator जैसा की नीचे दिखाया गया।

grunt> Dump student

एक बार जब आप ऊपर निष्पादित करते हैं Pig Latinबयान, यह HDFS से डेटा पढ़ने के लिए MapReduce का काम शुरू करेगा। यह निम्न आउटपुट का उत्पादन करेगा।

2015-10-01 15:05:27,642 [main]
INFO  org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLauncher - 
100% complete
2015-10-01 15:05:27,652 [main]
INFO  org.apache.pig.tools.pigstats.mapreduce.SimplePigStats - Script Statistics:   
HadoopVersion  PigVersion  UserId    StartedAt             FinishedAt       Features             
2.6.0          0.15.0      Hadoop  2015-10-01 15:03:11  2015-10-01 05:27     UNKNOWN
                                                
Success!  
Job Stats (time in seconds):
  
JobId           job_14459_0004
Maps                 1  
Reduces              0  
MaxMapTime          n/a    
MinMapTime          n/a
AvgMapTime          n/a 
MedianMapTime       n/a
MaxReduceTime        0
MinReduceTime        0  
AvgReduceTime        0
MedianReducetime     0
Alias             student 
Feature           MAP_ONLY        
Outputs           hdfs://localhost:9000/tmp/temp580182027/tmp757878456,

Input(s): Successfully read 0 records from: "hdfs://localhost:9000/pig_data/
student_data.txt"
  
Output(s): Successfully stored 0 records in: "hdfs://localhost:9000/tmp/temp580182027/
tmp757878456"  

Counters: Total records written : 0 Total bytes written : 0 Spillable Memory Manager 
spill count : 0Total bags proactively spilled: 0 Total records proactively spilled: 0  

Job DAG: job_1443519499159_0004
  
2015-10-01 15:06:28,403 [main]
INFO  org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLau ncher - Success!
2015-10-01 15:06:28,441 [main] INFO  org.apache.pig.data.SchemaTupleBackend - 
Key [pig.schematuple] was not set... will not generate code.
2015-10-01 15:06:28,485 [main]
INFO  org.apache.hadoop.mapreduce.lib.input.FileInputFormat - Total input paths 
to process : 1
2015-10-01 15:06:28,485 [main]
INFO  org.apache.pig.backend.hadoop.executionengine.util.MapRedUtil - Total input paths
to process : 1

(1,Rajiv,Reddy,9848022337,Hyderabad) (2,siddarth,Battacharya,9848022338,Kolkata) (3,Rajesh,Khanna,9848022339,Delhi) (4,Preethi,Agarwal,9848022330,Pune) (5,Trupthi,Mohanthy,9848022336,Bhuwaneshwar) (6,Archana,Mishra,9848022335,Chennai)