SAS - Mengurutkan Kumpulan Data

Kumpulan data di SAS dapat diurutkan berdasarkan variabel mana pun yang ada di dalamnya. Ini membantu dalam analisis data dan melakukan opsi lain seperti penggabungan, dll. Penyortiran dapat terjadi pada variabel tunggal dan juga banyak variabel. Prosedur SAS yang digunakan untuk melakukan penyortiran dalam kumpulan data SAS dinamaiPROC SORT. Hasil setelah pengurutan disimpan dalam kumpulan data baru dan kumpulan data asli tetap tidak berubah.

Sintaksis

Sintaks dasar untuk operasi pengurutan dalam kumpulan data di SAS adalah -

PROC SORT DATA = original dataset OUT = Sorted dataset;
   BY variable name;

Berikut ini adalah deskripsi parameter yang digunakan -

  • variable name adalah nama kolom tempat pengurutan terjadi.

  • Original dataset adalah nama kumpulan data yang akan diurutkan.

  • Sorted dataset adalah nama kumpulan data setelah diurutkan.

Contoh

Mari pertimbangkan kumpulan data SAS berikut yang berisi detail karyawan sebuah organisasi. Kita dapat menyortir kumpulan data gaji dengan menggunakan kode yang diberikan di bawah ini.

DATA Employee; 
   INPUT empid name $ salary DEPT $ ; 
DATALINES; 
1 Rick 623.3	IT 		 
2 Dan 515.2 	OPS	
3 Mike 611.5 	IT 	
4 Ryan 729.1    HR 
5 Gary 843.25   FIN 
6 Tusar 578.6   IT 
7 Pranab 632.8  OPS
8 Rasmi 722.5   FIN 
;
RUN;

PROC SORT DATA = Employee OUT = Sorted_sal ;
   BY salary;
RUN ;
 
PROC PRINT DATA = Sorted_sal;
RUN ;

Ketika kode di atas dijalankan, kita mendapatkan output berikut.

Penyortiran Terbalik

Opsi pengurutan default adalah dalam urutan menaik, yang berarti pengamatan diatur sesuai dengan nilai yang lebih rendah ke nilai yang lebih tinggi dari variabel yang diurutkan. Tetapi kita mungkin juga ingin hal itu terjadi dalam urutan menaik.

Contoh

Dalam kode di bawah ini, penyortiran terbalik dicapai dengan menggunakan pernyataan DESCENDING.

DATA Employee; 
   INPUT empid name $ salary DEPT $ ; 
DATALINES; 
1 Rick 623.3	IT 		 
2 Dan 515.2 	OPS	
3 Mike 611.5 	IT 	
4 Ryan 729.1    HR 
5 Gary 843.25   FIN 
6 Tusar 578.6   IT 
7 Pranab 632.8  OPS
8 Rasmi 722.5   FIN 
;
RUN;

PROC SORT DATA = Employee OUT = Sorted_sal_reverse ;
   BY DESCENDING salary;
RUN ;
 
PROC PRINT DATA = Sorted_sal_reverse;
RUN ;

Ketika kode di atas dijalankan, kita mendapatkan output berikut.

Menyortir Beberapa Variabel

Penyortiran dapat diterapkan ke beberapa variabel dengan menggunakannya dengan pernyataan BY. Variabel diurutkan dengan prioritas dari kiri ke kanan.

Contoh

Pada kode di bawah ini, kumpulan data diurutkan terlebih dahulu pada nama departemen variabel dan selanjutnya pada nama variabel gaji.

DATA Employee; 
   INPUT empid name $ salary DEPT $ ; 
DATALINES; 
1 Rick 623.3	IT 		 
2 Dan 515.2 	OPS	
3 Mike 611.5 	IT 	
4 Ryan 729.1    HR 
5 Gary 843.25   FIN 
6 Tusar 578.6   IT 
7 Pranab 632.8  OPS
8 Rasmi 722.5   FIN 
;
RUN;

PROC SORT DATA = Employee OUT = Sorted_dept_sal ;
   BY salary DEPT;
RUN ;
 
PROC PRINT DATA = Sorted_dept_sal;
RUN ;

Ketika kode di atas dijalankan, kita mendapatkan output berikut.