Nasıl olabilir $t$-istatik hipotezi test etmek için kullanılabilir mi?

Aug 15 2020

Şu sorum var: Normal dağılımdan 25 büyüklüğünde rastgele bir örnek ortalama 47 ve standart sapma 7'ye sahiptir. $t$-istatistik, verilen bilgilerin nüfusun ortalamasının 42 olduğu varsayımını desteklediğini söyleyebilir miyiz?

Nasıl gerçekten kafam karıştı $t$-istatistik, bir hipotezi reddetmeye veya reddetmeye çalışır. Bir açıklama gerçekten yardımcı olacaktır. Teşekkürler!

Yanıtlar

2 BruceET Aug 16 2020 at 01:35

İki Taraflı Tek Numune T-Testi

Sadece normal bir veri kümesine sahip oldu $n=25, \bar X = 57, S = 7$ R Oturum penceremde.

Veriler test sırasında uygun mu? İşte R ile hesaplanan verilerin bir özeti:

summary(x)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  35.18   40.78   44.83   47.00   52.35   61.34 
length(x); sd(x)
[1] 25   # sample size n = 25
[1] 7    # sample standard deviation S = 7.0

stripchart(x, pch="|")

Uzak uç değerleri olmayan yaklaşık simetrik veriler; Shapiro-Wilk normallik testini yukarıda bir P değeri ile geçer$0.05 = 5\%.$

shapiro.test(x)

        Shapiro-Wilk normality test

data:  x
W = 0.96136, p-value = 0.4423

Veriler, test sırasında geçerli olabilmesi için normale yeterince yakın.

T testi için R çıktısı. Böylece, burada tek örneklemli t testi için R'den çıktı$H_0: \mu = 42$ karşısında $H_a: \mu \ne 42.$

t.test(x, mu=42)

        One Sample t-test

data:  x
t = 3.5714, df = 24, p-value = 0.001543
alternative hypothesis: 
  true mean is not equal to 42
95 percent confidence interval:
  44.11054 49.88946
sample estimates:
mean of x 
       47

Çıktının yorumlanması. P değeri$0.0015 < 0.05 = 5\%,$ bu yüzden reddedersin $H_0$% 5 anlamlılık düzeyinde. % 1 seviyesinde de reddedebilirsiniz.

Çıktı ayrıca% 95 güven aralığı (CI) verir $(44.11, 49.89),$ böylece gerçek değerini $\mu$bu aralık içinde - etmez ki olup içeren$\mu = 42.$

Bu CI'nin yorumlarından biri, verilerinize bağlı olarak "reddedilemeyen" boş hipotezler aralığı olmasıdır.

Test hakkında bilmeniz gereken ayrıntılar. @PeterForeman size T-istatistiğini nasıl hesaplayacağınızı gösterdi. P değeri dışında, çıktıdaki diğer her şeyi elle hesaplama yoluyla yeniden üretebilmelisiniz.

Bilgisayar çıktılarında kesin P değerleri verilmiştir. Basılı bir t tablosuna bakarak , P değerini "parantez" alabilmelisiniz. Örneğin, masamın DF = 24 satırında 2.467 ve 3.745 değerleri var, bu da T-istatistiği 3.5714'ü desteklemektedir. Tablomun üst kenar boşluğuna baktığımda, P değerinin arasında olması gerektiğini görüyorum$2(0.001) = 0.002$ ve $2(0.0005) = 0.001,$bu, R'den gelen değer ile uyumludur. [ 2S, bunun 2 taraflı bir t testi olduğu içindir.]
Bu 2 taraflı testin tam P değerini R veya diğer istatistiksel yazılımlarda alabilirsiniz. Daha uzaktaki bir T istatistiğinin olasılığıdır.$0$ gözlenenden $T =3.5714.$ptStudent t dağılımının bir CDF'si olan R'de, aşağıdaki hesaplama sizi çıktıdaki P değerine çok yaklaştırır. (Bildirilen T istatistiğinin değeri yuvarlanmışsa, P değeri tam olarak eşleşmeyebilir, ancak karar verme için yalnızca ilk ondalık basamak önemlidir.)

2 * (1 - pt(3.5714, 24))
[1] 0.001543522

Sorularınızdan birini yorumlarda yanıtlamak için: Yazdırılan tablodan % 5 düzeyinde reddetme için kritik bir değerin olduğunu söyleyebilirsiniz.$c = 2.064.$ Yani% 5 seviyesinde reddedersiniz $|T| > 2.064,$hangisi. Kritik değer olasılığı azaltır$0.025 = 2.5\% $DF = 24 ile Student t dağılımının üst kuyruğundan. qtBir kuantil fonksiyonun (ters CDF) olduğu R'de, aşağıda gösterildiği gibi% 5 kritik değeri elde edebilirsiniz. % 1 anlamlılık düzeyinde bir test için kritik değer nedir?

${}$

qt(.975, 24)
[1] 2.063899

Grafiksel özet. Aşağıdaki şekil Student t dağılımının 24 DF ile yoğunluk fonksiyonunu göstermektedir. Dikey mavi benzer, T istatistiğinin gözlemlenen değerini gösterir. P değeri, bu çizginin sağındaki eğrinin altındaki alanın iki katıdır. % 5 seviyesindeki bir test için alt ve üst kritik değerler dikey noktalı turuncu çizgilerle gösterilir; % 1 seviyesinde bir test için kırmızı çizgiler (daha uzak).