Apache Pig - Operator Diagnostik
Itu loadpernyataan hanya akan memuat data ke dalam relasi yang ditentukan di Apache Pig. Untuk memverifikasi eksekusi fileLoad pernyataan, Anda harus menggunakan Diagnostic Operators. Pig Latin menyediakan empat jenis operator diagnostik -
- Operator sampah
- Jelaskan operator
- Operator penjelasan
- Operator ilustrasi
Dalam bab ini, kita akan membahas operator Dump Pig Latin.
Operator Sampah
Itu Dumpoperator digunakan untuk menjalankan pernyataan Pig Latin dan menampilkan hasilnya di layar. Ini umumnya digunakan untuk tujuan debugging.
Sintaksis
Diberikan di bawah ini adalah sintaks Dump operator.
grunt> Dump Relation_Name
Contoh
Asumsikan kita memiliki file student_data.txt dalam HDFS dengan konten berikut.
001,Rajiv,Reddy,9848022337,Hyderabad
002,siddarth,Battacharya,9848022338,Kolkata
003,Rajesh,Khanna,9848022339,Delhi
004,Preethi,Agarwal,9848022330,Pune
005,Trupthi,Mohanthy,9848022336,Bhuwaneshwar
006,Archana,Mishra,9848022335,Chennai.
Dan kami telah membacanya menjadi suatu relasi student menggunakan operator LOAD seperti yang ditunjukkan di bawah ini.
grunt> student = LOAD 'hdfs://localhost:9000/pig_data/student_data.txt'
USING PigStorage(',')
as ( id:int, firstname:chararray, lastname:chararray, phone:chararray,
city:chararray );
Sekarang, mari kita mencetak konten relasi menggunakan Dump operator seperti gambar dibawah.
grunt> Dump student
Setelah Anda menjalankan langkah di atas Pig Latinpernyataan, itu akan memulai pekerjaan MapReduce untuk membaca data dari HDFS. Ini akan menghasilkan keluaran sebagai berikut.
2015-10-01 15:05:27,642 [main]
INFO org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLauncher -
100% complete
2015-10-01 15:05:27,652 [main]
INFO org.apache.pig.tools.pigstats.mapreduce.SimplePigStats - Script Statistics:
HadoopVersion PigVersion UserId StartedAt FinishedAt Features
2.6.0 0.15.0 Hadoop 2015-10-01 15:03:11 2015-10-01 05:27 UNKNOWN
Success!
Job Stats (time in seconds):
JobId job_14459_0004
Maps 1
Reduces 0
MaxMapTime n/a
MinMapTime n/a
AvgMapTime n/a
MedianMapTime n/a
MaxReduceTime 0
MinReduceTime 0
AvgReduceTime 0
MedianReducetime 0
Alias student
Feature MAP_ONLY
Outputs hdfs://localhost:9000/tmp/temp580182027/tmp757878456,
Input(s): Successfully read 0 records from: "hdfs://localhost:9000/pig_data/
student_data.txt"
Output(s): Successfully stored 0 records in: "hdfs://localhost:9000/tmp/temp580182027/
tmp757878456"
Counters: Total records written : 0 Total bytes written : 0 Spillable Memory Manager
spill count : 0Total bags proactively spilled: 0 Total records proactively spilled: 0
Job DAG: job_1443519499159_0004
2015-10-01 15:06:28,403 [main]
INFO org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLau ncher - Success!
2015-10-01 15:06:28,441 [main] INFO org.apache.pig.data.SchemaTupleBackend -
Key [pig.schematuple] was not set... will not generate code.
2015-10-01 15:06:28,485 [main]
INFO org.apache.hadoop.mapreduce.lib.input.FileInputFormat - Total input paths
to process : 1
2015-10-01 15:06:28,485 [main]
INFO org.apache.pig.backend.hadoop.executionengine.util.MapRedUtil - Total input paths
to process : 1
(1,Rajiv,Reddy,9848022337,Hyderabad) (2,siddarth,Battacharya,9848022338,Kolkata) (3,Rajesh,Khanna,9848022339,Delhi) (4,Preethi,Agarwal,9848022330,Pune) (5,Trupthi,Mohanthy,9848022336,Bhuwaneshwar) (6,Archana,Mishra,9848022335,Chennai)