como puedo$t$-estadística ser utilizado para probar la hipótesis?

Aug 15 2020

Tengo la siguiente pregunta: una muestra aleatoria de tamaño 25 de una distribución normal tiene una media de 47 y una desviación estándar de 7. Con base en$t$-estadística, ¿podemos decir que la información dada apoya la conjetura de que la media de la población es 42?

Estoy realmente confundido cómo$t$-la estadistica trabaja para rechazar o dejar de rechazar una hipotesis. Una explicación sería muy útil. ¡Gracias!

Respuestas

2 BruceET Aug 16 2020 at 01:35

Prueba T bilateral de una muestra

Sucedió que tenía un conjunto de datos normal con$n=25, \bar X = 57, S = 7$en mi ventana de sesión R.

¿Son apropiados los datos para una prueba? Aquí hay un resumen de los datos, calculados por R:

summary(x)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  35.18   40.78   44.83   47.00   52.35   61.34 
length(x); sd(x)
[1] 25   # sample size n = 25
[1] 7    # sample standard deviation S = 7.0

stripchart(x, pch="|")

Datos aproximadamente simétricos sin valores atípicos lejanos; pasa la prueba de normalidad de Shapiro-Wilk con un valor P superior$0.05 = 5\%.$

shapiro.test(x)

        Shapiro-Wilk normality test

data:  x
W = 0.96136, p-value = 0.4423

Los datos están lo suficientemente cerca de lo normal para que la prueba sea válida.

Impresión R para la prueba t. Por lo tanto, aquí está la salida de R para una prueba t de una muestra de$H_0: \mu = 42$contra$H_a: \mu \ne 42.$

t.test(x, mu=42)

        One Sample t-test

data:  x
t = 3.5714, df = 24, p-value = 0.001543
alternative hypothesis: 
  true mean is not equal to 42
95 percent confidence interval:
  44.11054 49.88946
sample estimates:
mean of x 
       47

Interpretación de la salida. El valor P es$0.0015 < 0.05 = 5\%,$por lo que rechazarías$H_0$al 5% de nivel de significación. También puede rechazar al nivel del 1%.

La salida también proporciona un intervalo de confianza (IC) del 95 %$(44.11, 49.89),$por lo que podemos concluir el verdadero valor de$\mu$está en ese intervalo, que no contiene$\mu = 42.$

Una interpretación de este IC es que es un intervalo de hipótesis nulas "no rechazables", según sus datos.

Detalles que debe saber sobre la prueba. @PeterForeman le ha mostrado cómo calcular la estadística T. Excepto por el valor P, debería poder reproducir todo lo demás en la salida mediante cálculo manual.

Los valores P exactos se dan en las impresiones de la computadora. Al mirar una tabla impresa de t, debería poder 'entre paréntesis' el valor P. Por ejemplo, mi tabla tiene valores 2.467 y 3.745 en la línea DF = 24, que enmarcan la estadística T 3.5714. Mirando el margen superior de mi tabla, veo que el valor P debe estar entre$2(0.001) = 0.002$y$2(0.0005) = 0.001,$que concuerda con el valor de R. [La 2s se debe a que esta es una prueba t de 2 colas].
Puede obtener el valor P exacto de esta prueba bilateral en R u otro software estadístico. Es la probabilidad de que un estadístico T esté más lejos de$0$que lo observado$T =3.5714.$En R, donde ptes una CDF de la distribución t de Student, el siguiente cálculo lo acerca mucho al valor P en la impresión. (Si el valor de la estadística T informada se redondea, es posible que el valor P no coincida exactamente, pero solo los primeros decimales importan para la toma de decisiones).

2 * (1 - pt(3.5714, 24))
[1] 0.001543522

Para responder a una de sus preguntas en los comentarios: de la tabla t impresa, puede decir que un valor crítico para rechazar al nivel del 5% es$c = 2.064.$Es decir, usted rechazaría al nivel del 5% de$|T| > 2.064,$cual es. El valor crítico corta la probabilidad$0.025 = 2.5\% $de la cola superior de la distribución t de Student con DF = 24. En R, donde qtes una función cuantil (FDC inversa), puede obtener el valor crítico del 5% como se muestra a continuación. ¿Cuál es el valor crítico para una prueba al 1% de nivel de significación?

${}$

qt(.975, 24)
[1] 2.063899

Resumen gráfico. La siguiente figura muestra la función de densidad de la distribución t de Student con 24 DF. El azul vertical muestra el valor observado de la estadística T. El valor P es el doble del área bajo la curva a la derecha de esta línea. Los valores críticos inferior y superior para una prueba al nivel del 5% se muestran mediante líneas naranjas punteadas verticales; líneas rojas (más lejos) para una prueba al nivel del 1%.