SAS - Teste de Hipóteses
O teste de hipóteses é o uso de estatísticas para determinar a probabilidade de uma dada hipótese ser verdadeira. O processo usual de teste de hipóteses consiste em quatro etapas, conforme mostrado abaixo.
Passo 1
Formule a hipótese nula H0 (comumente, que as observações são o resultado do puro acaso) e a hipótese alternativa H1 (comumente, que as observações mostram um efeito real combinado com um componente de variação do acaso).
Passo 2
Identifique uma estatística de teste que pode ser usada para avaliar a verdade da hipótese nula.
Etapa 3
Calcule o valor P, que é a probabilidade de que uma estatística de teste pelo menos tão significativa quanto a observada seria obtida assumindo que a hipótese nula fosse verdadeira. Quanto menor o valor P, mais forte será a evidência contra a hipótese nula.
Passo 4
Compare o valor p com um valor de significância aceitável alfa (às vezes chamado de valor alfa). Se p <= alfa, que o efeito observado é estatisticamente significativo, a hipótese nula é descartada e a hipótese alternativa é válida.
A linguagem de programação SAS tem recursos para realizar vários tipos de teste de hipótese, conforme mostrado abaixo.
Teste | Descrição | SAS PROC |
---|---|---|
T-Test | Um teste t é usado para testar se a média de uma variável é significativamente diferente de um valor hipotético. Também determinamos se as médias para dois grupos independentes são significativamente diferentes e se as médias para grupos dependentes ou emparelhados são significativamente diferentes. | PROC TTEST |
ANOVA | Também é usado para comparar médias quando há uma variável categórica independente. Queremos usar ANOVA unilateral ao testar para ver se as médias da variável dependente do intervalo são diferentes de acordo com a variável categórica independente. | PROC ANOVA |
Chi-Square | Usamos a qualidade de ajuste do qui quadrado para avaliar se as frequências de uma variável categórica eram prováveis de acontecer devido ao acaso. O uso de um teste de qui quadrado é necessário se as proporções de uma variável categórica são um valor hipotético. | PROC FREQ |
Linear Regression | A regressão linear simples é usada quando se deseja testar o quão bem uma variável prediz outra variável. A regressão linear múltipla permite testar quão bem várias variáveis predizem uma variável de interesse. Ao usar a regressão linear múltipla, também assumimos que as variáveis preditoras são independentes. | PROC REG |