SAS-교차 표

교차 표에는 두 개 이상의 변수의 가능한 모든 조합을 사용하여 불확정 표라고도하는 교차 표를 생성하는 작업이 포함됩니다. SAS에서는 다음을 사용하여 생성됩니다.PROC FREQ 와 함께 TABLES선택권. 예를 들어, 각 자동차 유형 카테고리의 각 제조업체에 대한 각 모델의 빈도가 필요한 경우 PROC FREQ의 TABLES 옵션을 사용해야합니다.

통사론

SAS에서 교차 표를 적용하는 기본 구문은 다음과 같습니다.

PROC FREQ DATA = dataset;
TABLES variable_1*Variable_2;

다음은 사용 된 매개 변수에 대한 설명입니다.

  • Dataset 데이터 세트의 이름입니다.

  • Variable_1 and Variable_2 빈도 분포를 계산해야하는 데이터 세트의 변수 이름입니다.

생성 된 데이터 셋 cars1에서 각 자동차 브랜드에서 사용할 수있는 자동차 유형 수를 찾는 경우를 고려하십시오. SASHELP.CARS아래 그림과 같이. 이 경우 개별 주파수 값과 제조업체 및 유형 전체의 주파수 값 합계가 필요합니다. 결과가 행과 열에 걸쳐 값을 표시하는 것을 관찰 할 수 있습니다.

PROC SQL;
create table CARS1 as
SELECT make, type, invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc FREQ data = CARS1;
tables make*type; 
run;

위 코드가 실행되면 다음과 같은 결과가 나옵니다.

3 가지 변수의 교차 표

3 개의 변수가있을 때 2 개를 그룹화하고이 2 개를 세 번째 변수와 교차 표로 만들 수 있습니다. 결과적으로 두 개의 교차 테이블이 있습니다.

아래의 예에서 우리는 자동차 제조사와 관련하여 각 유형의 자동차와 각 자동차 모델의 빈도를 찾습니다. 또한 합계 및 백분율 값을 피하기 위해 nocol 및 norow 옵션을 사용합니다.

proc FREQ data = CARS2 ;
tables make * (type model)  / nocol norow nopercent;   
run;

위 코드가 실행되면 다음과 같은 결과가 나옵니다.

4 가지 변수의 교차 표

4 개의 변수를 사용하면 쌍을 이루는 조합의 수가 4 개로 증가합니다. 그룹 1의 각 변수는 그룹 2의 각 변수와 쌍을 이룹니다.

아래 예에서 각 제조사와 모델에 대한 자동차 길이의 빈도를 찾습니다. 마찬가지로 각 제조업체 및 각 모델의 마력 빈도.

proc FREQ data = CARS2 ;
tables (make model) * (length  horsepower)  / nocol norow nopercent;   
run;

위 코드가 실행되면 다음과 같은 결과가 나옵니다.