Como pode$t$-estatística pode ser usada para testar hipóteses?

Aug 15 2020

Tenho a seguinte dúvida: Uma amostra aleatória de tamanho 25 de uma distribuição normal tem média 47 e desvio padrão 7. Baseado em$t$-estatísticas, podemos dizer que as informações fornecidas apóiam a conjectura de que a média da população é 42?

Estou realmente confuso como$t$-estatística trabalha para rejeitar ou não rejeitar uma hipótese. Uma explicação seria muito útil. Obrigado!

Respostas

2 BruceET Aug 16 2020 at 01:35

Teste T Bilateral de Uma Amostra

Aconteceu de ter um conjunto de dados normal com$n=25, \bar X = 57, S = 7$na minha janela R Session.

Os dados são apropriados para o teste? Aqui está um resumo dos dados, calculados por R:

summary(x)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  35.18   40.78   44.83   47.00   52.35   61.34 
length(x); sd(x)
[1] 25   # sample size n = 25
[1] 7    # sample standard deviation S = 7.0

stripchart(x, pch="|")

Dados aproximadamente simétricos sem outliers distantes; passa no teste de normalidade de Shapiro-Wilk com um valor P acima$0.05 = 5\%.$

shapiro.test(x)

        Shapiro-Wilk normality test

data:  x
W = 0.96136, p-value = 0.4423

Os dados estão próximos o suficiente do normal para que o teste seja válido.

R impressão para o teste t. Assim, aqui está a saída de R para um teste t de uma amostra de$H_0: \mu = 42$contra$H_a: \mu \ne 42.$

t.test(x, mu=42)

        One Sample t-test

data:  x
t = 3.5714, df = 24, p-value = 0.001543
alternative hypothesis: 
  true mean is not equal to 42
95 percent confidence interval:
  44.11054 49.88946
sample estimates:
mean of x 
       47

Interpretação da saída. O valor P é$0.0015 < 0.05 = 5\%,$então você rejeitaria$H_0$ao nível de significância de 5%. Você também pode rejeitar no nível de 1%.

A saída também fornece um intervalo de confiança (IC) de 95%$(44.11, 49.89),$para que possamos concluir o verdadeiro valor de$\mu$está naquele intervalo – que não contém$\mu = 42.$

Uma interpretação desse IC é que ele é um intervalo de hipóteses nulas "não rejeitáveis", com base em seus dados.

Detalhes que você deve saber sobre o teste. @PeterForeman mostrou como calcular a estatística T. Exceto pelo valor P, você deve ser capaz de reproduzir todo o resto na saída por computação manual.

Os valores P exatos são fornecidos em impressões de computador. Olhando para uma tabela impressa de t, você deve ser capaz de 'colocar entre colchetes' o valor-P. Por exemplo, minha tabela tem valores 2,467 e 3,745 na linha DF = 24, que representam a estatística T 3,5714. Olhando para a margem superior da minha tabela, vejo que o valor P deve estar entre$2(0.001) = 0.002$e$2(0.0005) = 0.001,$que concorda com o valor de R. [Os 2s são porque este é um teste t de 2 lados.]
Você pode obter o valor P exato desse teste bilateral em R ou outro software estatístico. É a probabilidade de uma estatística T mais distante de$0$do que o observado$T =3.5714.$Em R, onde pté um CDF da distribuição t de Student, o cálculo a seguir o aproxima muito do valor P na impressão. (Se o valor da estatística T relatada for arredondado, então o valor P pode não corresponder exatamente, mas apenas as primeiras casas decimais importam para a tomada de decisão.)

2 * (1 - pt(3.5714, 24))
[1] 0.001543522

Para responder a uma de suas perguntas nos comentários: A partir da tabela t impressa, você pode dizer que um valor crítico para rejeição no nível de 5% é$c = 2.064.$Ou seja, você rejeitaria no nível de 5% de$|T| > 2.064,$qual é. O valor crítico reduz a probabilidade$0.025 = 2.5\% $da cauda superior da distribuição t de Student com DF = 24. Em R, onde qté uma função quantílica (CDF inversa), você pode obter o valor crítico de 5% conforme mostrado abaixo. Qual é o valor crítico para um teste no nível de significância de 1%?

${}$

qt(.975, 24)
[1] 2.063899

Resumo gráfico. A figura abaixo mostra a função de densidade da distribuição t de Student com 24 DF. O azul vertical mostra o valor observado da estatística T. O valor P é o dobro da área sob a curva à direita desta linha. Os valores críticos inferiores e superiores para um teste no nível de 5% são mostrados por linhas laranja pontilhadas verticais; linhas vermelhas (mais distantes) para um teste no nível de 1%.