SAS - Histogramy

Histogram to graficzne przedstawienie danych za pomocą słupków o różnej wysokości. Grupuje różne liczby w zestawie danych w wiele zakresów. Reprezentuje również oszacowanie prawdopodobieństwa rozkładu zmiennej ciągłej. W SASPROC UNIVARIATE służy do tworzenia histogramów z poniższymi opcjami.

Składnia

Podstawowa składnia tworzenia histogramu w SAS to -

PROC UNIVARAITE DATA = DATASET;
HISTOGRAM variables;
RUN;

Poniżej znajduje się opis użytych parametrów -

  • DATASET to nazwa używanego zbioru danych.

  • variables są wartościami używanymi do wykreślenia histogramu.

Prosty histogram

Prosty histogram jest tworzony przez podanie nazwy zmiennej i zakresu, który ma być brany pod uwagę przy grupowaniu wartości.

Przykład

W poniższym przykładzie rozważymy minimalne i maksymalne wartości zmiennej mocy i przyjmujemy zakres 50. Zatem wartości tworzą grupę w krokach po 50.

proc univariate data = sashelp.cars;
   histogram horsepower
   / midpoints = 176 to 350 by 50;
run;

Kiedy wykonujemy powyższy kod, otrzymujemy następujący wynik -

Histogram z dopasowaniem krzywej

Niektóre krzywe rozkładu możemy dopasować do histogramu za pomocą dodatkowych opcji.

Przykład

W poniższym przykładzie dopasowujemy krzywą rozkładu z wartościami średniej i odchylenia standardowego podanymi jako EST. Ta opcja wykorzystuje i szacuje parametry.

proc univariate data = sashelp.cars noprint;
histogram horsepower
/ 
normal ( 
   mu = est
   sigma = est
   color = blue
   w = 2.5 
)
barlabel = percent
midpoints = 70 to 550 by 50;
run;

Kiedy wykonujemy powyższy kod, otrzymujemy następujący wynik -