SAS - Ô hộp

Boxplot là biểu diễn đồ họa của các nhóm dữ liệu số thông qua các phần tư của chúng. Các ô dạng hộp cũng có thể có các đường kéo dài theo chiều dọc từ các ô (râu) cho biết sự thay đổi bên ngoài phần tư trên và dưới. Dưới cùng và trên cùng của hộp luôn là phần tư thứ nhất và thứ ba, và dải bên trong hộp luôn là phần tư thứ hai (trung vị). Trong SAS, một Boxplot đơn giản được tạo bằng cách sử dụngPROC SGPLOT và ô boxplot được tạo bằng cách sử dụng PROC SGPANEL.

Xin lưu ý rằng chúng tôi tạo tập dữ liệu có tên CARS1 trong ví dụ đầu tiên và sử dụng cùng một tập dữ liệu cho tất cả các tập dữ liệu tiếp theo. Tập dữ liệu này vẫn còn trong thư viện công việc cho đến khi kết thúc phiên SAS.

Cú pháp

Cú pháp cơ bản để tạo boxplot trong SAS là:

PROC SGPLOT  DATA = DATASET;
   VBOX VARIABLE / category = VARIABLE;
RUN; 

PROC SGPANEL  DATA = DATASET;;
PANELBY VARIABLE;
   VBOX VARIABLE> / category = VARIABLE;
RUN;

Sau đây là mô tả các tham số được sử dụng:

  • DATASET - là tên của tập dữ liệu được sử dụng.

  • VARIABLE - là giá trị được sử dụng để vẽ Boxplot.

Boxplot đơn giản

Trong một Boxplot đơn giản, chúng ta chọn một biến từ tập dữ liệu và một biến khác để tạo thành một danh mục. Các giá trị của biến đầu tiên được phân loại thành nhiều nhóm bằng số lượng giá trị khác biệt trong biến thứ hai.

Thí dụ

Trong ví dụ dưới đây, chúng tôi chọn biến mã lực làm biến đầu tiên và nhập làm biến danh mục. Vì vậy, chúng tôi nhận được các hộp để phân phối các giá trị mã lực cho từng loại ô tô.

PROC SQL;
create table CARS1 as
SELECT make, model, type, invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

PROC SGPLOT  DATA = CARS1;
   VBOX horsepower 
   / category = type;

   title 'Horsepower of cars by types';
RUN;

Khi chúng tôi thực thi đoạn mã trên, chúng tôi nhận được kết quả sau:

Boxplot trong Bảng dọc

Chúng ta có thể chia Boxplots của một biến thành nhiều ô dọc (cột). Mỗi bảng điều khiển chứa các ô cho tất cả các biến phân loại. Nhưng các ô hộp được nhóm thêm bằng cách sử dụng một biến thứ ba khác chia biểu đồ thành nhiều ô.

Thí dụ

Trong ví dụ dưới đây, chúng tôi đã phân loại biểu đồ bằng cách sử dụng biến 'make'. Vì có hai giá trị khác nhau của 'make' nên chúng tôi nhận được hai bảng dọc.

PROC SGPANEL  DATA = CARS1;
PANELBY MAKE;
   VBOX horsepower   / category = type;

   title 'Horsepower of cars by types';
RUN;

Khi chúng tôi thực thi đoạn mã trên, chúng tôi nhận được kết quả sau:

Boxplot trong Bảng ngang

Chúng ta có thể chia Boxplots của một biến thành nhiều ô ngang (hàng). Mỗi bảng điều khiển chứa các ô cho tất cả các biến phân loại. Nhưng các ô hộp được nhóm thêm bằng cách sử dụng một biến thứ ba khác chia biểu đồ thành nhiều ô. Trong ví dụ dưới đây, chúng tôi đã phân loại biểu đồ bằng cách sử dụng biến 'make'. Vì có hai giá trị khác nhau của 'make' nên chúng ta nhận được hai bảng nằm ngang.

PROC SGPANEL  DATA = CARS1;
PANELBY MAKE / columns = 1 novarname;

   VBOX horsepower   / category = type;

   title 'Horsepower of cars by types';
RUN;

Khi chúng tôi thực thi đoạn mã trên, chúng tôi nhận được kết quả sau: