SAS - Phân phối tần số

Phân bố tần suất là một bảng hiển thị tần suất của các điểm dữ liệu trong tập dữ liệu. Mỗi mục nhập trong bảng chứa tần suất hoặc số lần xuất hiện của các giá trị trong một nhóm hoặc khoảng thời gian cụ thể và theo cách này, bảng tóm tắt sự phân bố của các giá trị trong mẫu.

SAS cung cấp một thủ tục được gọi là PROC FREQ để tính toán sự phân bố tần suất của các điểm dữ liệu trong tập dữ liệu.

Cú pháp

Cú pháp cơ bản để tính toán phân bố tần số trong SAS là:

PROC FREQ DATA = Dataset ;
TABLES Variable_1 ;
BY Variable_2 ;

Sau đây là mô tả về các tham số được sử dụng:

  • Dataset là tên của tập dữ liệu.

  • Variables_1 là các tên biến của tập dữ liệu có sự phân bố tần số cần được tính toán.

  • Variables_2 là các biến đã phân loại kết quả phân phối tần số.

Phân phối tần số biến đơn

Chúng ta có thể xác định phân phối tần suất của một biến đơn lẻ bằng cách sử dụng PROC FREQ.Trong trường hợp này, kết quả sẽ hiển thị tần suất xuất hiện của từng giá trị của biến. Kết quả cũng cho thấy phân phối phần trăm, tần suất tích lũy và phần trăm tích lũy.

Thí dụ

Trong ví dụ dưới đây, chúng tôi tìm thấy phân phối tần số của mã lực biến đổi cho tập dữ liệu có tên CARS1 được tạo thành thư viện SASHELP.CARS.Chúng ta có thể thấy kết quả được chia thành hai loại kết quả. Một chiếc cho mỗi chiếc xe.

PROC SQL;
create table CARS1 as
SELECT make, model, type, invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc FREQ data = CARS1 ;
tables horsepower; 
by make;
run;

Khi đoạn mã trên được thực thi, chúng tôi nhận được kết quả sau:

Phân phối nhiều tần số biến đổi

Chúng ta có thể tìm thấy phân bố tần số cho nhiều biến để nhóm chúng thành tất cả các kết hợp có thể.

Thí dụ

Trong ví dụ dưới đây, chúng tôi tính toán phân bố tần số cho việc tạo ra một chiếc ô tô cho grouped by car type và phân bố tần suất của từng loại ô tô grouped by each make.

proc FREQ data = CARS1 ;
tables make type; 
run;

Khi đoạn mã trên được thực thi, chúng tôi nhận được kết quả sau:

Phân bố tần số với trọng lượng

Với tùy chọn trọng số, chúng ta có thể tính toán phân phối tần số thiên vị với trọng số của biến. Ở đây giá trị của biến được lấy làm số lần quan sát thay vì giá trị đếm.

Thí dụ

Trong ví dụ dưới đây, chúng tôi tính toán sự phân bố tần số của các biến được tạo và loại với trọng số được gán cho mã lực.

proc FREQ data = CARS1 ;
tables make type; 
weight horsepower;
run;

Khi đoạn mã trên được thực thi, chúng tôi nhận được kết quả sau: