SAS - Định dạng tập dữ liệu

Đôi khi, chúng tôi muốn hiển thị dữ liệu được phân tích ở định dạng khác với định dạng mà dữ liệu đã có trong tập dữ liệu. Ví dụ, chúng tôi muốn thêm ký hiệu đô la và hai chữ số thập phân vào một biến có thông tin giá. Hoặc chúng tôi có thể muốn hiển thị một biến văn bản, tất cả đều được viết hoa. Chúng ta có thể sử dụngFORMAT để áp dụng các định dạng SAS có sẵn và PROC FORMATlà áp dụng các định dạng do người dùng xác định. Ngoài ra, một định dạng duy nhất có thể được áp dụng cho nhiều biến.

Cú pháp

Cú pháp cơ bản để áp dụng các định dạng SAS có sẵn là:

format variable name format name

Sau đây là mô tả về các tham số được sử dụng:

  • variable name là tên biến được sử dụng trong tập dữ liệu.

  • format name là định dạng dữ liệu sẽ được áp dụng trên biến.

Thí dụ

Hãy xem xét tập dữ liệu SAS dưới đây chứa thông tin chi tiết về nhân viên của một tổ chức. Chúng tôi muốn hiển thị tất cả các tên bằng chữ hoa. Cácformatstatement được sử dụng để đạt được điều này.

DATA Employee; 
   INPUT empid name $ salary DEPT $ ; 
   format name $upcase9. ;
DATALINES; 
1 Rick 623.3	IT 		 
2 Dan 515.2 	OPS	
3 Mike 611.5 	IT 	
4 Ryan 729.1    HR 
5 Gary 843.25   FIN 
6 Tusar 578.6   IT 
7 Pranab 632.8  OPS
8 Rasmi 722.5   FIN 
;
RUN;
   PROC PRINT DATA = Employee; 
RUN;

Khi đoạn mã trên được thực thi, chúng ta nhận được kết quả sau.

Sử dụng PROC FORMAT

Chúng tôi cũng có thể sử dụng PROC FORMATđể định dạng dữ liệu. Trong ví dụ dưới đây, chúng tôi gán giá trị mới cho biến DEPT trừ tên của bộ phận.

DATA Employee; 
   INPUT empid name $ salary DEPT $ ; 

DATALINES; 
1 Rick 623.3 IT 		 
2 Dan 515.2 OPS
3 Mike 611.5 IT 	
4 Ryan 729.1 HR 
5 Gary 843.25 FIN 
6 Tusar 578.6 IT 
7 Pranab 632.8 OPS
8 Rasmi 722.5 FIN 
;
proc format;
value $DEP 'IT' = 'Information Technology'
      'OPS'= 'Operations' ;
RUN;
   PROC PRINT DATA = Employee; 
   format name $upcase9. DEPT $DEP.; 
RUN;

Khi đoạn mã trên được thực thi, chúng ta nhận được kết quả sau.