Apache Pig - Operator Serikat
Itu UNIONOperator Pig Latin digunakan untuk menggabungkan konten dari dua relasi. Untuk melakukan operasi UNION pada dua relasi, kolom dan domainnya harus identik.
Sintaksis
Diberikan di bawah ini adalah sintaks UNION operator.
grunt> Relation_name3 = UNION Relation_name1, Relation_name2;
Contoh
Asumsikan kita memiliki dua file yaitu student_data1.txt dan student_data2.txt dalam /pig_data/ direktori HDFS seperti yang ditunjukkan di bawah ini.
Student_data1.txt
001,Rajiv,Reddy,9848022337,Hyderabad
002,siddarth,Battacharya,9848022338,Kolkata
003,Rajesh,Khanna,9848022339,Delhi
004,Preethi,Agarwal,9848022330,Pune
005,Trupthi,Mohanthy,9848022336,Bhuwaneshwar
006,Archana,Mishra,9848022335,Chennai.
Student_data2.txt
7,Komal,Nayak,9848022334,trivendram.
8,Bharathi,Nambiayar,9848022333,Chennai.
Dan kami telah memuat dua file ini ke Pig dengan relasi student1 dan student2 seperti gambar dibawah.
grunt> student1 = LOAD 'hdfs://localhost:9000/pig_data/student_data1.txt' USING PigStorage(',')
as (id:int, firstname:chararray, lastname:chararray, phone:chararray, city:chararray);
grunt> student2 = LOAD 'hdfs://localhost:9000/pig_data/student_data2.txt' USING PigStorage(',')
as (id:int, firstname:chararray, lastname:chararray, phone:chararray, city:chararray);
Sekarang mari kita gabungkan konten dari dua relasi ini menggunakan UNION operator seperti yang ditunjukkan di bawah ini.
grunt> student = UNION student1, student2;
Verifikasi
Verifikasi relasinya student menggunakan DUMP operator seperti yang ditunjukkan di bawah ini.
grunt> Dump student;
Keluaran
Ini akan menampilkan output berikut, menampilkan konten relasi student.
(1,Rajiv,Reddy,9848022337,Hyderabad) (2,siddarth,Battacharya,9848022338,Kolkata)
(3,Rajesh,Khanna,9848022339,Delhi)
(4,Preethi,Agarwal,9848022330,Pune)
(5,Trupthi,Mohanthy,9848022336,Bhuwaneshwar)
(6,Archana,Mishra,9848022335,Chennai)
(7,Komal,Nayak,9848022334,trivendram)
(8,Bharathi,Nambiayar,9848022333,Chennai)