SAS - Histogramas
Um histograma é a exibição gráfica de dados usando barras de diferentes alturas. Ele agrupa os vários números no conjunto de dados em vários intervalos. Também representa a estimativa da probabilidade de distribuição de uma variável contínua. No SAS oPROC UNIVARIATE é usado para criar histogramas com as opções abaixo.
Sintaxe
A sintaxe básica para criar um histograma no SAS é -
PROC UNIVARAITE DATA = DATASET;
HISTOGRAM variables;
RUN;
A seguir está a descrição dos parâmetros usados -
DATASET é o nome do conjunto de dados usado.
variables são os valores usados para traçar o histograma.
Histograma Simples
Um histograma simples é criado especificando o nome da variável e o intervalo a ser considerado para agrupar os valores.
Exemplo
No exemplo a seguir, consideramos os valores mínimo e máximo da variável de potência e tomamos um intervalo de 50. Portanto, os valores formam um grupo em etapas de 50.
proc univariate data = sashelp.cars;
histogram horsepower
/ midpoints = 176 to 350 by 50;
run;
Quando executamos o código acima, obtemos a seguinte saída -
Histograma com ajuste de curva
Podemos ajustar algumas curvas de distribuição no histograma usando opções adicionais.
Exemplo
No exemplo abaixo, ajustamos uma curva de distribuição com valores de média e desvio padrão mencionados como EST. Esta opção usa e estima os parâmetros.
proc univariate data = sashelp.cars noprint;
histogram horsepower
/
normal (
mu = est
sigma = est
color = blue
w = 2.5
)
barlabel = percent
midpoints = 70 to 550 by 50;
run;
Quando executamos o código acima, obtemos a seguinte saída -