SAS-원시 데이터 읽기
SAS는 다양한 파일 형식을 포함하는 다양한 소스에서 데이터를 읽을 수 있습니다. SAS 환경에서 사용되는 파일 형식은 아래에서 설명합니다.
- ASCII (텍스트) 데이터 세트
- 구분 된 데이터
- Excel 데이터
- 계층 적 데이터
ASCII (텍스트) 데이터 세트 읽기
이들은 텍스트 형식의 데이터를 포함하는 파일입니다. 데이터는 일반적으로 공백으로 구분되지만 SAS가 처리 할 수있는 여러 유형의 구분 기호도있을 수 있습니다. 직원 데이터가 포함 된 ASCII 파일을 고려해 보겠습니다. 이 파일은Infile SAS에서 사용할 수있는 성명.
예
아래 예에서 우리는 emp_data.txt 지역 환경에서.
data TEMP;
infile
'/folders/myfolders/sasuser.v94/TutorialsPoint/emp_data.txt';
input empID empName $ Salary Dept $ DOJ date9. ;
format DOJ date9.;
run;
PROC PRINT DATA = TEMP;
RUN;
위의 코드가 실행되면 다음과 같은 결과가 나옵니다.
구분 된 데이터 읽기
열 값이 쉼표 나 파이프 라인 등과 같은 구분 문자로 구분되는 데이터 파일입니다.이 경우에는 dlm 옵션 infile 성명서.
예
아래 예에서는 로컬 환경에서 emp.csv라는 데이터 파일을 읽습니다.
data TEMP;
infile
'/folders/myfolders/sasuser.v94/TutorialsPoint/emp.csv' dlm=",";
input empID empName $ Salary Dept $ DOJ date9. ;
format DOJ date9.;
run;
PROC PRINT DATA = TEMP;
RUN;
위의 코드가 실행되면 다음과 같은 결과가 나옵니다.
Excel 데이터 읽기
SAS는 가져 오기 기능을 사용하여 Excel 파일을 직접 읽을 수 있습니다. SAS 데이터 세트 장에서 볼 수 있듯이 MS Excel을 포함한 다양한 파일 유형을 처리 할 수 있습니다. emp.xls 파일이 SAS 환경에서 로컬로 사용 가능하다고 가정합니다.
예
FILENAME REFFILE
"/folders/myfolders/TutorialsPoint/emp.xls"
TERMSTR = CR;
PROC IMPORT DATAFILE = REFFILE
DBMS = XLS
OUT = WORK.IMPORT;
GETNAMES = YES;
RUN;
PROC PRINT DATA = WORK.IMPORT RUN;
위의 코드는 Excel 파일에서 데이터를 읽고 위의 두 파일 유형과 동일한 출력을 제공합니다.
계층 파일 읽기
이 파일에서 데이터는 계층 적 형식으로 표시됩니다. 주어진 관찰에 대해 아래에 많은 세부 레코드가 언급 된 헤더 레코드가 있습니다. 세부 기록의 수는 관찰마다 다를 수 있습니다. 다음은 계층 적 파일의 그림입니다.
아래 파일에는 각 부서의 각 직원에 대한 세부 정보가 나열되어 있습니다. 첫 번째 레코드는 부서를 언급하는 헤더 레코드이고 다음 레코드는 DTLS로 시작하는 몇 개의 레코드가 세부 사항 레코드입니다.
DEPT:IT
DTLS:1:Rick:623
DTLS:3:Mike:611
DTLS:6:Tusar:578
DEPT:OPS
DTLS:7:Pranab:632
DTLS:2:Dan:452
DEPT:HR
DTLS:4:Ryan:487
DTLS:2:Siyona:452
예
계층 파일을 읽기 위해 IF 절로 헤더 레코드를 식별하고 do 루프를 사용하여 세부 레코드를 처리하는 아래 코드를 사용합니다.
data employees(drop = Type);
length Type $ 3 Department
empID $ 3 empName $ 10 Empsal 3 ;
retain Department;
infile
'/folders/myfolders/TutorialsPoint/empdtls.txt' dlm = ':';
input Type $ @;
if Type = 'DEP' then
input Department $;
else do;
input empID empName $ Empsal ;
output;
end;
run;
PROC PRINT DATA = employees;
RUN;
위의 코드가 실행되면 다음과 같은 결과가 나옵니다.