SAS - Veri Kümelerini Sırala

SAS'daki veri kümeleri, içlerinde bulunan değişkenlerin herhangi birine göre sıralanabilir. Bu, hem veri analizinde hem de birleştirme vb. Gibi diğer seçeneklerin gerçekleştirilmesine yardımcı olur. Sıralama, tek bir değişkenin yanı sıra birden çok değişken üzerinde de olabilir. SAS veri setinde sıralamayı gerçekleştirmek için kullanılan SAS prosedürü,PROC SORT. Sıralamadan sonraki sonuç yeni bir veri kümesinde saklanır ve orijinal veri kümesi değişmeden kalır.

Sözdizimi

SAS'daki veri kümesindeki sıralama işlemi için temel sözdizimi şudur:

PROC SORT DATA = original dataset OUT = Sorted dataset;
   BY variable name;

Aşağıda kullanılan parametrelerin açıklaması verilmiştir -

  • variable name sıralamanın gerçekleştiği sütun adıdır.

  • Original dataset sıralanacak veri kümesi adıdır.

  • Sorted dataset sıralandıktan sonraki veri kümesinin adıdır.

Misal

Bir organizasyonun çalışan detaylarını içeren aşağıdaki SAS veri setini ele alalım. Aşağıda verilen kodu kullanarak veri setini maaş üzerinden sıralayabiliriz.

DATA Employee; 
   INPUT empid name $ salary DEPT $ ; 
DATALINES; 
1 Rick 623.3	IT 		 
2 Dan 515.2 	OPS	
3 Mike 611.5 	IT 	
4 Ryan 729.1    HR 
5 Gary 843.25   FIN 
6 Tusar 578.6   IT 
7 Pranab 632.8  OPS
8 Rasmi 722.5   FIN 
;
RUN;

PROC SORT DATA = Employee OUT = Sorted_sal ;
   BY salary;
RUN ;
 
PROC PRINT DATA = Sorted_sal;
RUN ;

Yukarıdaki kod çalıştırıldığında aşağıdaki çıktıyı alıyoruz.

Ters Sıralama

Varsayılan sıralama seçeneği artan düzendedir, bu da gözlemlerin sıralanan değişkenin küçükten yükseğe değerine göre düzenlendiği anlamına gelir. Ancak sıralamanın artan sırada olmasını da isteyebiliriz.

Misal

Aşağıdaki kodda, DESCENDING ifadesi kullanılarak ters sıralama elde edilmiştir.

DATA Employee; 
   INPUT empid name $ salary DEPT $ ; 
DATALINES; 
1 Rick 623.3	IT 		 
2 Dan 515.2 	OPS	
3 Mike 611.5 	IT 	
4 Ryan 729.1    HR 
5 Gary 843.25   FIN 
6 Tusar 578.6   IT 
7 Pranab 632.8  OPS
8 Rasmi 722.5   FIN 
;
RUN;

PROC SORT DATA = Employee OUT = Sorted_sal_reverse ;
   BY DESCENDING salary;
RUN ;
 
PROC PRINT DATA = Sorted_sal_reverse;
RUN ;

Yukarıdaki kod çalıştırıldığında aşağıdaki çıktıyı alıyoruz.

Birden Çok Değişkeni Sıralama

Sıralama, BY ifadesiyle kullanılarak birden çok değişkene uygulanabilir. Değişkenler soldan sağa bir öncelik ile sıralanır.

Misal

Aşağıdaki kodda, veri seti önce değişken departman adına ve ardından değişken adı maaşına göre sıralanmıştır.

DATA Employee; 
   INPUT empid name $ salary DEPT $ ; 
DATALINES; 
1 Rick 623.3	IT 		 
2 Dan 515.2 	OPS	
3 Mike 611.5 	IT 	
4 Ryan 729.1    HR 
5 Gary 843.25   FIN 
6 Tusar 578.6   IT 
7 Pranab 632.8  OPS
8 Rasmi 722.5   FIN 
;
RUN;

PROC SORT DATA = Employee OUT = Sorted_dept_sal ;
   BY salary DEPT;
RUN ;
 
PROC PRINT DATA = Sorted_dept_sal;
RUN ;

Yukarıdaki kod çalıştırıldığında aşağıdaki çıktıyı alıyoruz.