Apache Pig - Opérateurs de diagnostic

le loadL'instruction chargera simplement les données dans la relation spécifiée dans Apache Pig. Pour vérifier l'exécution duLoad déclaration, vous devez utiliser la Diagnostic Operators. Pig Latin propose quatre types différents d'opérateurs de diagnostic -

  • Opérateur de vidage
  • Décrire l'opérateur
  • Explication opérateur
  • Opérateur d'illustration

Dans ce chapitre, nous aborderons les opérateurs de vidage de Pig Latin.

Opérateur de vidage

le DumpL'opérateur est utilisé pour exécuter les instructions Pig Latin et afficher les résultats à l'écran. Il est généralement utilisé pour le débogage Objectif.


Ci-dessous, la syntaxe du Dump opérateur.

grunt> Dump Relation_Name


Supposons que nous ayons un fichier student_data.txt en HDFS avec le contenu suivant.


Et nous l'avons lu dans une relation student en utilisant l'opérateur LOAD comme indiqué ci-dessous.

grunt> student = LOAD 'hdfs://localhost:9000/pig_data/student_data.txt' 
   USING PigStorage(',')
   as ( id:int, firstname:chararray, lastname:chararray, phone:chararray, 
   city:chararray );

Maintenant, imprimons le contenu de la relation en utilisant le Dump operator comme indiqué ci-dessous.

grunt> Dump student

Une fois que vous exécutez ce qui précède Pig Latin, il lancera une tâche MapReduce pour lire les données à partir de HDFS. Il produira la sortie suivante.

2015-10-01 15:05:27,642 [main]
INFO  org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLauncher - 
100% complete
2015-10-01 15:05:27,652 [main]
INFO  org.apache.pig.tools.pigstats.mapreduce.SimplePigStats - Script Statistics:   
HadoopVersion  PigVersion  UserId    StartedAt             FinishedAt       Features             
2.6.0          0.15.0      Hadoop  2015-10-01 15:03:11  2015-10-01 05:27     UNKNOWN
Job Stats (time in seconds):
JobId           job_14459_0004
Maps                 1  
Reduces              0  
MaxMapTime          n/a    
MinMapTime          n/a
AvgMapTime          n/a 
MedianMapTime       n/a
MaxReduceTime        0
MinReduceTime        0  
AvgReduceTime        0
MedianReducetime     0
Alias             student 
Feature           MAP_ONLY        
Outputs           hdfs://localhost:9000/tmp/temp580182027/tmp757878456,

Input(s): Successfully read 0 records from: "hdfs://localhost:9000/pig_data/
Output(s): Successfully stored 0 records in: "hdfs://localhost:9000/tmp/temp580182027/

Counters: Total records written : 0 Total bytes written : 0 Spillable Memory Manager 
spill count : 0Total bags proactively spilled: 0 Total records proactively spilled: 0  

Job DAG: job_1443519499159_0004
2015-10-01 15:06:28,403 [main]
INFO  org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLau ncher - Success!
2015-10-01 15:06:28,441 [main] INFO  org.apache.pig.data.SchemaTupleBackend - 
Key [pig.schematuple] was not set... will not generate code.
2015-10-01 15:06:28,485 [main]
INFO  org.apache.hadoop.mapreduce.lib.input.FileInputFormat - Total input paths 
to process : 1
2015-10-01 15:06:28,485 [main]
INFO  org.apache.pig.backend.hadoop.executionengine.util.MapRedUtil - Total input paths
to process : 1

(1,Rajiv,Reddy,9848022337,Hyderabad) (2,siddarth,Battacharya,9848022338,Kolkata) (3,Rajesh,Khanna,9848022339,Delhi) (4,Preethi,Agarwal,9848022330,Pune) (5,Trupthi,Mohanthy,9848022336,Bhuwaneshwar) (6,Archana,Mishra,9848022335,Chennai)