SAS - Veri Kümelerini Alt Kümeleme

Bir SAS veri kümesinin alt kümelenmesi, daha az sayıda değişken veya daha az sayıda gözlem veya her ikisini birden seçerek veri kümesinin bir bölümünü çıkarmak anlamına gelir. Değişkenlerin alt kümelenmesi kullanılarak yapılırkenKEEP ve DROP ifadesi, gözlemlerin alt ayarı kullanılarak yapılır DELETE Beyan.

Ayrıca, alt kümeleme işleminden elde edilen veriler, daha fazla analiz için kullanılabilen yeni bir veri setinde tutulur. Alt ortam, esas olarak, analizle ilgili olmayabilecek değişkenleri veya gözlemleri kullanmadan veri setinin bir bölümünü analiz etmek amacıyla kullanılır.

Değişkenleri Alt Kümeleme

Bu yöntemde, tüm veri kümesinden yalnızca birkaç değişken çıkarıyoruz.

Sözdizimi

SAS'daki alt ayar değişkenleri için temel sözdizimi şudur:

KEEP var1 var2 ... ;
DROP var1 var2 ... ;

Kullanılan parametrelerin açıklaması aşağıdadır -

  • var1 and var2 tutulması veya bırakılması gereken veri kümesindeki değişken isimleridir.

Misal

Bir kuruluşun çalışan ayrıntılarını içeren aşağıdaki SAS veri kümesini göz önünde bulundurun. Veri setinden sadece İsim ve Departman değerlerini almakla ilgileniyorsak, aşağıdaki kodu kullanabiliriz.

DATA Employee; 
   INPUT empid ename $ salary DEPT $ ; 
DATALINES; 
1 Rick 623.3 	IT 		 
2 Dan 515.2 	OPS	
3 Mike 611.5 	IT 	
4 Ryan 729.1    HR 
5 Gary 843.25   FIN 
6 Tusar 578.6   IT 
7 Pranab 632.8  OPS
8 Rasmi 722.5   FIN 
;
RUN;
DATA OnlyDept;
   SET Employee;
   KEEP ename DEPT;
   RUN;
   PROC PRINT DATA = OnlyDept; 
RUN;

Yukarıdaki kod çalıştırıldığında aşağıdaki çıktıyı alıyoruz.

Aynı sonuç, gerekli olmayan değişkenler bırakılarak da elde edilebilir. Aşağıdaki kod bunu göstermektedir.

DATA Employee; 
   INPUT empid ename $ salary DEPT $ ; 
DATALINES; 
1 Rick 623.3 	IT 		 
2 Dan 515.2 	OPS	
3 Mike 611.5 	IT 	
4 Ryan 729.1    HR 
5 Gary 843.25   FIN 
6 Tusar 578.6   IT 
7 Pranab 632.8  OPS
8 Rasmi 722.5   FIN 
;
RUN;
DATA OnlyDept;
   SET Employee;
   DROP empid salary;
   RUN;
   PROC PRINT DATA = OnlyDept; 
RUN;

Gözlemleri Alt Kümeye Alma

Bu yöntemde, tüm veri setinden yalnızca birkaç gözlem çıkarıyoruz.

Sözdizimi

Yeni veri seti için seçilen gözlemleri takip eden PROC FREQ kullanıyoruz.

Alt ayar gözlemleri için sözdizimi -

IF Var Condition THEN DELETE ;

Kullanılan parametrelerin açıklaması aşağıdadır -

  • Var değerine dayalı olarak gözlemlerin belirtilen koşul kullanılarak silineceği değişkenin adıdır.

Misal

Bir kuruluşun çalışan ayrıntılarını içeren aşağıdaki SAS veri kümesini göz önünde bulundurun. Yalnızca 700'den fazla maaşı olan çalışanların verilerini almakla ilgileniyorsak, aşağıdaki kodu kullanırız.

DATA Employee; 
   INPUT empid name $ salary DEPT $ ; 
DATALINES; 
1 Rick 623.3	IT 		 
2 Dan 515.2 	OPS	
3 Mike 611.5 	IT 	
4 Ryan 729.1    HR 
5 Gary 843.25   FIN 
6 Tusar 578.6   IT 
7 Pranab 632.8  OPS
8 Rasmi 722.5   FIN 
;
RUN;
DATA OnlyDept;
   SET Employee;
   IF salary < 700 THEN DELETE;
   RUN;
   PROC PRINT DATA = OnlyDept; 
RUN;

Yukarıdaki kod çalıştırıldığında aşağıdaki çıktıyı alıyoruz.