SAS - Structure du programme

La programmation SAS consiste d'abord à créer / lire les ensembles de données dans la mémoire, puis à faire l'analyse de ces données. Nous devons comprendre le flux dans lequel un programme est écrit pour y parvenir.

Structure du programme SAS

Le diagramme ci-dessous montre les étapes à écrire dans la séquence donnée pour créer un programme SAS.

Chaque programme SAS doit avoir toutes ces étapes pour terminer la lecture des données d'entrée, analyser les données et donner la sortie de l'analyse. ÉgalementRUN une déclaration à la fin de chaque étape est nécessaire pour terminer l'exécution de cette étape.

Étape DATA

Cette étape consiste à charger l'ensemble de données requis dans la mémoire SAS et à identifier les variables (également appelées colonnes) de l'ensemble de données. Il capture également les enregistrements (également appelés observations ou sujets). La syntaxe de l'instruction DATA est la suivante.

Syntaxe

DATA data_set_name;		#Name the data set.
INPUT var1,var2,var3; 		#Define the variables in this data set.
NEW_VAR;			#Create new variables.
LABEL;			      	#Assign labels to variables.
DATALINES;		      	#Enter the data.
RUN;

Exemple

L'exemple ci-dessous montre un cas simple de dénomination de l'ensemble de données, de définition des variables, de création de nouvelles variables et de saisie des données. Ici, les variables de chaîne ont un $ à la fin et les valeurs numériques sont sans.

DATA TEMP;
INPUT ID $ NAME $ SALARY DEPARTMENT $;
comm = SALARY*0.25;
LABEL ID = 'Employee ID' comm = 'COMMISION';
DATALINES;
1 Rick 623.3 IT
2 Dan 515.2 Operations
3 Michelle 611 IT
4 Ryan 729 HR
5 Gary 843.25 Finance
6 Nina 578 IT
7 Simon 632.8 Operations
8 Guru 722.5 Finance
;
RUN;

Étape PROC

Cette étape implique l'appel d'une procédure intégrée SAS pour analyser les données.

Syntaxe

PROC procedure_name options; #The name of the proc.
RUN;

Exemple

L'exemple ci-dessous montre l'utilisation du MEANS procédure pour imprimer les valeurs moyennes des variables numériques dans l'ensemble de données.

PROC MEANS;
RUN;

L'étape OUTPUT

Les données des ensembles de données peuvent être affichées avec des instructions de sortie conditionnelles.

Syntaxe

PROC PRINT DATA = data_set;
OPTIONS;
RUN;

Exemple

L'exemple ci-dessous montre l'utilisation de la clause where dans la sortie pour ne produire que quelques enregistrements de l'ensemble de données.

PROC PRINT DATA = TEMP;
WHERE SALARY > 700;
RUN;

Le programme SAS complet

Vous trouverez ci-dessous le code complet de chacune des étapes ci-dessus.

Sortie du programme

La sortie du code ci-dessus est visible dans le RESULTS languette.