SAS-원시 데이터 읽기

SAS는 다양한 파일 형식을 포함하는 다양한 소스에서 데이터를 읽을 수 있습니다. SAS 환경에서 사용되는 파일 형식은 아래에서 설명합니다.

  • ASCII (텍스트) 데이터 세트
  • 구분 된 데이터
  • Excel 데이터
  • 계층 적 데이터

ASCII (텍스트) 데이터 세트 읽기

이들은 텍스트 형식의 데이터를 포함하는 파일입니다. 데이터는 일반적으로 공백으로 구분되지만 SAS가 처리 할 수있는 여러 유형의 구분 기호도있을 수 있습니다. 직원 데이터가 포함 된 ASCII 파일을 고려해 보겠습니다. 이 파일은Infile SAS에서 사용할 수있는 성명.

아래 예에서 우리는 emp_data.txt 지역 환경에서.

data TEMP; 
   infile 
   '/folders/myfolders/sasuser.v94/TutorialsPoint/emp_data.txt'; 
   input empID empName $ Salary Dept $ DOJ date9. ;
   format DOJ date9.;
   run;
   PROC PRINT DATA = TEMP;
RUN;

위의 코드가 실행되면 다음과 같은 결과가 나옵니다.

구분 된 데이터 읽기

열 값이 쉼표 나 파이프 라인 등과 같은 구분 문자로 구분되는 데이터 파일입니다.이 경우에는 dlm 옵션 infile 성명서.

아래 예에서는 로컬 환경에서 emp.csv라는 데이터 파일을 읽습니다.

data TEMP; 
   infile 
   '/folders/myfolders/sasuser.v94/TutorialsPoint/emp.csv' dlm=","; 
   input empID empName $ Salary Dept $ DOJ date9. ;
   format DOJ date9.;
   run;
   PROC PRINT DATA = TEMP;
RUN;

위의 코드가 실행되면 다음과 같은 결과가 나옵니다.

Excel 데이터 읽기

SAS는 가져 오기 기능을 사용하여 Excel 파일을 직접 읽을 수 있습니다. SAS 데이터 세트 장에서 볼 수 있듯이 MS Excel을 포함한 다양한 파일 유형을 처리 할 수 ​​있습니다. emp.xls 파일이 SAS 환경에서 로컬로 사용 가능하다고 가정합니다.

FILENAME REFFILE
"/folders/myfolders/TutorialsPoint/emp.xls"
TERMSTR = CR;

PROC IMPORT DATAFILE = REFFILE
DBMS = XLS
OUT = WORK.IMPORT;
GETNAMES = YES;
RUN;
PROC PRINT DATA = WORK.IMPORT RUN;

위의 코드는 Excel 파일에서 데이터를 읽고 위의 두 파일 유형과 동일한 출력을 제공합니다.

계층 파일 읽기

이 파일에서 데이터는 계층 적 형식으로 표시됩니다. 주어진 관찰에 대해 아래에 많은 세부 레코드가 언급 된 헤더 레코드가 있습니다. 세부 기록의 수는 관찰마다 다를 수 있습니다. 다음은 계층 적 파일의 그림입니다.

아래 파일에는 각 부서의 각 직원에 대한 세부 정보가 나열되어 있습니다. 첫 번째 레코드는 부서를 언급하는 헤더 레코드이고 다음 레코드는 DTLS로 시작하는 몇 개의 레코드가 세부 사항 레코드입니다.

DEPT:IT 
DTLS:1:Rick:623 
DTLS:3:Mike:611 
DTLS:6:Tusar:578 
DEPT:OPS
DTLS:7:Pranab:632
DTLS:2:Dan:452
DEPT:HR
DTLS:4:Ryan:487
DTLS:2:Siyona:452

계층 파일을 읽기 위해 IF 절로 헤더 레코드를 식별하고 do 루프를 사용하여 세부 레코드를 처리하는 아래 코드를 사용합니다.

data employees(drop = Type);
   length Type $ 3  Department
      empID $ 3 empName $ 10 Empsal 3 ;
   retain Department;
   infile 
   '/folders/myfolders/TutorialsPoint/empdtls.txt' dlm = ':';
   input Type $ @;
   if Type = 'DEP' then 
      input Department $;
   else do;
      input empID  empName $ Empsal ;
      output;
   end;
run;

   PROC PRINT DATA = employees;
RUN;

위의 코드가 실행되면 다음과 같은 결과가 나옵니다.