SAS - Гистограммы

Гистограмма - это графическое отображение данных с использованием полос разной высоты. Он группирует различные числа в наборе данных по множеству диапазонов. Он также представляет собой оценку вероятности распределения непрерывной переменной. В SASPROC UNIVARIATE используется для создания гистограмм с указанными ниже параметрами.

Синтаксис

Основной синтаксис для создания гистограммы в SAS -

PROC UNIVARAITE DATA = DATASET;
HISTOGRAM variables;
RUN;

Ниже приводится описание используемых параметров -

  • DATASET это имя используемого набора данных.

  • variables - значения, используемые для построения гистограммы.

Простая гистограмма

Простая гистограмма создается путем указания имени переменной и диапазона, который следует рассматривать для группировки значений.

пример

В приведенном ниже примере мы рассматриваем минимальное и максимальное значения переменной мощности в диапазоне 50. Таким образом, значения образуют группу с шагом 50.

proc univariate data = sashelp.cars;
   histogram horsepower
   / midpoints = 176 to 350 by 50;
run;

Когда мы выполняем приведенный выше код, мы получаем следующий вывод -

Гистограмма с подгонкой кривой

Мы можем вписать некоторые кривые распределения в гистограмму, используя дополнительные параметры.

пример

В приведенном ниже примере мы подбираем кривую распределения со значениями среднего и стандартного отклонения, указанными как EST. Эта опция использует и оценку параметров.

proc univariate data = sashelp.cars noprint;
histogram horsepower
/ 
normal ( 
   mu = est
   sigma = est
   color = blue
   w = 2.5 
)
barlabel = percent
midpoints = 70 to 550 by 50;
run;

Когда мы выполняем приведенный выше код, мы получаем следующий вывод -