SAS - Histogramy
Histogram to graficzne przedstawienie danych za pomocą słupków o różnej wysokości. Grupuje różne liczby w zestawie danych w wiele zakresów. Reprezentuje również oszacowanie prawdopodobieństwa rozkładu zmiennej ciągłej. W SASPROC UNIVARIATE służy do tworzenia histogramów z poniższymi opcjami.
Składnia
Podstawowa składnia tworzenia histogramu w SAS to -
PROC UNIVARAITE DATA = DATASET;
HISTOGRAM variables;
RUN;
Poniżej znajduje się opis użytych parametrów -
DATASET to nazwa używanego zbioru danych.
variables są wartościami używanymi do wykreślenia histogramu.
Prosty histogram
Prosty histogram jest tworzony przez podanie nazwy zmiennej i zakresu, który ma być brany pod uwagę przy grupowaniu wartości.
Przykład
W poniższym przykładzie rozważymy minimalne i maksymalne wartości zmiennej mocy i przyjmujemy zakres 50. Zatem wartości tworzą grupę w krokach po 50.
proc univariate data = sashelp.cars;
histogram horsepower
/ midpoints = 176 to 350 by 50;
run;
Kiedy wykonujemy powyższy kod, otrzymujemy następujący wynik -
Histogram z dopasowaniem krzywej
Niektóre krzywe rozkładu możemy dopasować do histogramu za pomocą dodatkowych opcji.
Przykład
W poniższym przykładzie dopasowujemy krzywą rozkładu z wartościami średniej i odchylenia standardowego podanymi jako EST. Ta opcja wykorzystuje i szacuje parametry.
proc univariate data = sashelp.cars noprint;
histogram horsepower
/
normal (
mu = est
sigma = est
color = blue
w = 2.5
)
barlabel = percent
midpoints = 70 to 550 by 50;
run;
Kiedy wykonujemy powyższy kod, otrzymujemy następujący wynik -