SAS-プログラム構造

SASプログラミングでは、最初にデータセットを作成してメモリに読み込み、次にこのデータの分析を行います。これを実現するには、プログラムが作成されるフローを理解する必要があります。

SASプログラム構造

次の図は、SASプログラムを作成するために指定された順序で記述される手順を示しています。

すべてのSASプログラムには、入力データの読み取り、データの分析、および分析の出力の提供を完了するために、これらすべてのステップが必要です。また、RUN そのステップの実行を完了するには、各ステップの最後にあるステートメントが必要です。

データステップ

このステップでは、必要なデータセットをSASメモリにロードし、データセットの変数(列とも呼ばれます)を識別します。また、レコード(観測または対象とも呼ばれます)をキャプチャします。DATAステートメントの構文は次のとおりです。

構文

DATA data_set_name;		#Name the data set.
INPUT var1,var2,var3; 		#Define the variables in this data set.
NEW_VAR;			#Create new variables.
LABEL;			      	#Assign labels to variables.
DATALINES;		      	#Enter the data.
RUN;

以下の例は、データセットに名前を付け、変数を定義し、新しい変数を作成し、データを入力する簡単なケースを示しています。ここで、文字列変数の末尾には$があり、数値には$がありません。

DATA TEMP;
INPUT ID $ NAME $ SALARY DEPARTMENT $;
comm = SALARY*0.25;
LABEL ID = 'Employee ID' comm = 'COMMISION';
DATALINES;
1 Rick 623.3 IT
2 Dan 515.2 Operations
3 Michelle 611 IT
4 Ryan 729 HR
5 Gary 843.25 Finance
6 Nina 578 IT
7 Simon 632.8 Operations
8 Guru 722.5 Finance
;
RUN;

PROCステップ

このステップでは、SAS組み込みプロシージャを呼び出してデータを分析します。

構文

PROC procedure_name options; #The name of the proc.
RUN;

以下の例は、 MEANS データセット内の数値変数の平均値を出力する手順。

PROC MEANS;
RUN;

OUTPUTステップ

データセットのデータは、条件付き出力ステートメントで表示できます。

構文

PROC PRINT DATA = data_set;
OPTIONS;
RUN;

次の例は、出力でwhere句を使用して、データセットから少数のレコードのみを生成する方法を示しています。

PROC PRINT DATA = TEMP;
WHERE SALARY > 700;
RUN;

完全なSASプログラム

以下は、上記の各ステップの完全なコードです。

プログラム出力

上記のコードからの出力は、 RESULTS タブ。