SAS - podzbiór zbiorów danych

Podzbiór zestawu danych SAS oznacza wyodrębnienie części zestawu danych poprzez wybranie mniejszej liczby zmiennych lub mniejszej liczby obserwacji lub obu. Podczas gdy podzbiór zmiennych odbywa się za pomocąKEEP i DROP instrukcji, pod-ustawienie obserwacji odbywa się za pomocą DELETE komunikat.

Również dane wynikowe z operacji podzbioru są przechowywane w nowym zestawie danych, który można wykorzystać do dalszej analizy. Ustawienie podrzędne jest używane głównie w celu analizy części zbioru danych bez wykorzystywania tych zmiennych lub obserwacji, które mogą nie mieć znaczenia dla analizy.

Podzbiór zmiennych

W tej metodzie wyodrębniamy tylko kilka zmiennych z całego zbioru danych.

Składnia

Podstawowa składnia zmiennych ustawień podrzędnych w SAS to -

KEEP var1 var2 ... ;
DROP var1 var2 ... ;

Poniżej znajduje się opis użytych parametrów -

  • var1 and var2 są nazwami zmiennych ze zbioru danych, które należy zachować lub usunąć.

Przykład

Rozważ poniższy zestaw danych SAS zawierający dane pracowników organizacji. Jeśli interesuje nas tylko pobranie wartości Nazwa i Dział ze zbioru danych, możemy skorzystać z poniższego kodu.

DATA Employee; 
   INPUT empid ename $ salary DEPT $ ; 
DATALINES; 
1 Rick 623.3 	IT 		 
2 Dan 515.2 	OPS	
3 Mike 611.5 	IT 	
4 Ryan 729.1    HR 
5 Gary 843.25   FIN 
6 Tusar 578.6   IT 
7 Pranab 632.8  OPS
8 Rasmi 722.5   FIN 
;
RUN;
DATA OnlyDept;
   SET Employee;
   KEEP ename DEPT;
   RUN;
   PROC PRINT DATA = OnlyDept; 
RUN;

Po wykonaniu powyższego kodu otrzymujemy następujące dane wyjściowe.

Ten sam wynik można uzyskać, usuwając zmienne, które nie są wymagane. Poniższy kod ilustruje to.

DATA Employee; 
   INPUT empid ename $ salary DEPT $ ; 
DATALINES; 
1 Rick 623.3 	IT 		 
2 Dan 515.2 	OPS	
3 Mike 611.5 	IT 	
4 Ryan 729.1    HR 
5 Gary 843.25   FIN 
6 Tusar 578.6   IT 
7 Pranab 632.8  OPS
8 Rasmi 722.5   FIN 
;
RUN;
DATA OnlyDept;
   SET Employee;
   DROP empid salary;
   RUN;
   PROC PRINT DATA = OnlyDept; 
RUN;

Subsetting Observations

W tej metodzie wyodrębniamy tylko kilka obserwacji z całego zbioru danych.

Składnia

Używamy PROC FREQ, który śledzi obserwacje wybrane dla nowego zestawu danych.

Składnia obserwacji ustawień podrzędnych to -

IF Var Condition THEN DELETE ;

Poniżej znajduje się opis użytych parametrów -

  • Var to nazwa zmiennej na podstawie której wartości obserwacje zostaną usunięte przy użyciu określonego warunku.

Przykład

Rozważ poniższy zestaw danych SAS zawierający dane pracowników organizacji. Jeżeli interesuje nas tylko pozyskanie danych dla pracowników z wynagrodzeniem powyżej 700, to posługujemy się poniższym kodem.

DATA Employee; 
   INPUT empid name $ salary DEPT $ ; 
DATALINES; 
1 Rick 623.3	IT 		 
2 Dan 515.2 	OPS	
3 Mike 611.5 	IT 	
4 Ryan 729.1    HR 
5 Gary 843.25   FIN 
6 Tusar 578.6   IT 
7 Pranab 632.8  OPS
8 Rasmi 722.5   FIN 
;
RUN;
DATA OnlyDept;
   SET Employee;
   IF salary < 700 THEN DELETE;
   RUN;
   PROC PRINT DATA = OnlyDept; 
RUN;

Po wykonaniu powyższego kodu otrzymujemy następujące dane wyjściowe.