SAS - Membuat Subset Kumpulan Data

Membuat subset dari kumpulan data SAS berarti mengekstraksi bagian dari kumpulan data dengan memilih lebih sedikit variabel atau lebih sedikit jumlah observasi atau keduanya. Sedangkan subset variabel dilakukan dengan menggunakanKEEP dan DROP pernyataan, sub pengaturan pengamatan dilakukan dengan menggunakan DELETE pernyataan.

Juga data yang dihasilkan dari operasi subset disimpan dalam kumpulan data baru yang dapat digunakan untuk analisis lebih lanjut. Sub pengaturan terutama digunakan untuk tujuan menganalisis bagian dari kumpulan data tanpa menggunakan variabel atau pengamatan yang mungkin tidak relevan dengan analisis.

Variabel Subset

Dalam metode ini kami mengekstrak hanya beberapa variabel dari seluruh kumpulan data.

Sintaksis

Sintaks dasar untuk sub pengaturan variabel di SAS adalah -

KEEP var1 var2 ... ;
DROP var1 var2 ... ;

Berikut ini adalah deskripsi parameter yang digunakan -

  • var1 and var2 adalah nama variabel dari kumpulan data yang perlu disimpan atau dihapus.

Contoh

Pertimbangkan kumpulan data SAS di bawah ini yang berisi detail karyawan dari suatu organisasi. Jika kita hanya tertarik untuk mendapatkan nilai Nama dan Departemen dari kumpulan data, maka kita dapat menggunakan kode di bawah ini.

DATA Employee; 
   INPUT empid ename $ salary DEPT $ ; 
DATALINES; 
1 Rick 623.3 	IT 		 
2 Dan 515.2 	OPS	
3 Mike 611.5 	IT 	
4 Ryan 729.1    HR 
5 Gary 843.25   FIN 
6 Tusar 578.6   IT 
7 Pranab 632.8  OPS
8 Rasmi 722.5   FIN 
;
RUN;
DATA OnlyDept;
   SET Employee;
   KEEP ename DEPT;
   RUN;
   PROC PRINT DATA = OnlyDept; 
RUN;

Ketika kode di atas dijalankan, kita mendapatkan output berikut.

Hasil yang sama dapat diperoleh dengan menghilangkan variabel yang tidak diperlukan. Kode di bawah ini menggambarkan hal ini.

DATA Employee; 
   INPUT empid ename $ salary DEPT $ ; 
DATALINES; 
1 Rick 623.3 	IT 		 
2 Dan 515.2 	OPS	
3 Mike 611.5 	IT 	
4 Ryan 729.1    HR 
5 Gary 843.25   FIN 
6 Tusar 578.6   IT 
7 Pranab 632.8  OPS
8 Rasmi 722.5   FIN 
;
RUN;
DATA OnlyDept;
   SET Employee;
   DROP empid salary;
   RUN;
   PROC PRINT DATA = OnlyDept; 
RUN;

Pengamatan Subsetting

Dalam metode ini kami mengekstrak hanya beberapa pengamatan dari seluruh kumpulan data.

Sintaksis

Kami menggunakan PROC FREQ yang melacak observasi yang dipilih untuk kumpulan data baru.

Sintaks untuk observasi sub setting adalah -

IF Var Condition THEN DELETE ;

Berikut ini adalah deskripsi parameter yang digunakan -

  • Var adalah nama variabel yang nilainya observasi akan dihapus menggunakan kondisi yang ditentukan.

Contoh

Pertimbangkan kumpulan data SAS di bawah ini yang berisi detail karyawan dari suatu organisasi. Jika kita hanya tertarik untuk mendapatkan data karyawan dengan gaji lebih dari 700, maka kita menggunakan kode di bawah ini.

DATA Employee; 
   INPUT empid name $ salary DEPT $ ; 
DATALINES; 
1 Rick 623.3	IT 		 
2 Dan 515.2 	OPS	
3 Mike 611.5 	IT 	
4 Ryan 729.1    HR 
5 Gary 843.25   FIN 
6 Tusar 578.6   IT 
7 Pranab 632.8  OPS
8 Rasmi 722.5   FIN 
;
RUN;
DATA OnlyDept;
   SET Employee;
   IF salary < 700 THEN DELETE;
   RUN;
   PROC PRINT DATA = OnlyDept; 
RUN;

Ketika kode di atas dijalankan, kita mendapatkan output berikut.