SAS - коробчатые диаграммы

Коробчатая диаграмма - это графическое представление групп числовых данных через их квартили. Коробчатые диаграммы также могут иметь линии, идущие вертикально от прямоугольников (усов), указывающие на изменчивость за пределами верхнего и нижнего квартилей. Нижняя и верхняя части прямоугольника всегда являются первым и третьим квартилями, а полоса внутри прямоугольника всегда является вторым квартилем (медиана). В SAS простой Boxplot создается с использованиемPROC SGPLOT и рамочная диаграмма создается с использованием PROC SGPANEL.

Обратите внимание, что мы создаем набор данных с именем CARS1 в первом примере и используем тот же набор данных для всех последующих наборов данных. Этот набор данных остается в рабочей библиотеке до конца сеанса SAS.

Синтаксис

Базовый синтаксис для создания блочной диаграммы в SAS -

PROC SGPLOT  DATA = DATASET;
   VBOX VARIABLE / category = VARIABLE;
RUN; 

PROC SGPANEL  DATA = DATASET;;
PANELBY VARIABLE;
   VBOX VARIABLE> / category = VARIABLE;
RUN;

Ниже приводится описание используемых параметров -

  • DATASET - это имя используемого набора данных.

  • VARIABLE - значение, используемое для построения коробчатой ​​диаграммы.

Простая коробчатая диаграмма

В простом ящичном графике мы выбираем одну переменную из набора данных, а другую - для формирования категории. Значения первой переменной разбиты на столько групп, сколько различных значений во второй переменной.

пример

В приведенном ниже примере мы выбираем переменную мощность в качестве первой переменной и вводим в качестве переменной категории. Таким образом, мы получаем коробчатые диаграммы распределения значений лошадиных сил для каждого типа автомобиля.

PROC SQL;
create table CARS1 as
SELECT make, model, type, invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

PROC SGPLOT  DATA = CARS1;
   VBOX horsepower 
   / category = type;

   title 'Horsepower of cars by types';
RUN;

Когда мы выполняем приведенный выше код, мы получаем следующий вывод -

Коробчатая диаграмма на вертикальных панелях

Мы можем разделить прямоугольные диаграммы переменной на множество вертикальных панелей (столбцов). Каждая панель содержит коробчатые диаграммы для всех категориальных переменных. Но коробчатые диаграммы дополнительно группируются с использованием еще одной третьей переменной, которая делит график на несколько панелей.

пример

В приведенном ниже примере мы обставили график панелями, используя переменную make. Поскольку есть два различных значения make, мы получаем две вертикальные панели.

PROC SGPANEL  DATA = CARS1;
PANELBY MAKE;
   VBOX horsepower   / category = type;

   title 'Horsepower of cars by types';
RUN;

Когда мы выполняем приведенный выше код, мы получаем следующий вывод -

Коробчатая диаграмма на горизонтальных панелях

Мы можем разделить Boxplots переменной на множество горизонтальных панелей (строк). Каждая панель содержит коробчатые диаграммы для всех категориальных переменных. Но коробчатые диаграммы дополнительно группируются с использованием еще одной третьей переменной, которая делит график на несколько панелей. В приведенном ниже примере мы обставили график панелями, используя переменную make. Поскольку есть два различных значения make, мы получаем две горизонтальные панели.

PROC SGPANEL  DATA = CARS1;
PANELBY MAKE / columns = 1 novarname;

   VBOX horsepower   / category = type;

   title 'Horsepower of cars by types';
RUN;

Когда мы выполняем приведенный выше код, мы получаем следующий вывод -