Nasıl olabilir $t$-istatik hipotezi test etmek için kullanılabilir mi?
Şu sorum var: Normal dağılımdan 25 büyüklüğünde rastgele bir örnek ortalama 47 ve standart sapma 7'ye sahiptir. $t$-istatistik, verilen bilgilerin nüfusun ortalamasının 42 olduğu varsayımını desteklediğini söyleyebilir miyiz?
Nasıl gerçekten kafam karıştı $t$-istatistik, bir hipotezi reddetmeye veya reddetmeye çalışır. Bir açıklama gerçekten yardımcı olacaktır. Teşekkürler!
Yanıtlar
İki Taraflı Tek Numune T-Testi
Sadece normal bir veri kümesine sahip oldu $n=25, \bar X = 57, S = 7$ R Oturum penceremde.
Veriler test sırasında uygun mu? İşte R ile hesaplanan verilerin bir özeti:
summary(x)
Min. 1st Qu. Median Mean 3rd Qu. Max.
35.18 40.78 44.83 47.00 52.35 61.34
length(x); sd(x)
[1] 25 # sample size n = 25
[1] 7 # sample standard deviation S = 7.0
stripchart(x, pch="|")
Uzak uç değerleri olmayan yaklaşık simetrik veriler; Shapiro-Wilk normallik testini yukarıda bir P değeri ile geçer$0.05 = 5\%.$
shapiro.test(x)
Shapiro-Wilk normality test
data: x
W = 0.96136, p-value = 0.4423
Veriler, test sırasında geçerli olabilmesi için normale yeterince yakın.
T testi için R çıktısı. Böylece, burada tek örneklemli t testi için R'den çıktı$H_0: \mu = 42$ karşısında $H_a: \mu \ne 42.$
t.test(x, mu=42)
One Sample t-test
data: x
t = 3.5714, df = 24, p-value = 0.001543
alternative hypothesis:
true mean is not equal to 42
95 percent confidence interval:
44.11054 49.88946
sample estimates:
mean of x
47
Çıktının yorumlanması. P değeri$0.0015 < 0.05 = 5\%,$ bu yüzden reddedersin $H_0$% 5 anlamlılık düzeyinde. % 1 seviyesinde de reddedebilirsiniz.
Çıktı ayrıca% 95 güven aralığı (CI) verir $(44.11, 49.89),$ böylece gerçek değerini $\mu$bu aralık içinde - etmez ki olup içeren$\mu = 42.$
Bu CI'nin yorumlarından biri, verilerinize bağlı olarak "reddedilemeyen" boş hipotezler aralığı olmasıdır.
Test hakkında bilmeniz gereken ayrıntılar. @PeterForeman size T-istatistiğini nasıl hesaplayacağınızı gösterdi. P değeri dışında, çıktıdaki diğer her şeyi elle hesaplama yoluyla yeniden üretebilmelisiniz.
Bilgisayar çıktılarında kesin P değerleri verilmiştir. Basılı bir t tablosuna bakarak , P değerini "parantez" alabilmelisiniz. Örneğin, masamın DF = 24 satırında 2.467 ve 3.745 değerleri var, bu da T-istatistiği 3.5714'ü desteklemektedir. Tablomun üst kenar boşluğuna baktığımda, P değerinin arasında olması gerektiğini görüyorum$2(0.001) = 0.002$ ve $2(0.0005) = 0.001,$bu, R'den gelen değer ile uyumludur. [
2
S, bunun 2 taraflı bir t testi olduğu içindir.]Bu 2 taraflı testin tam P değerini R veya diğer istatistiksel yazılımlarda alabilirsiniz. Daha uzaktaki bir T istatistiğinin olasılığıdır.$0$ gözlenenden $T =3.5714.$
pt
Student t dağılımının bir CDF'si olan R'de, aşağıdaki hesaplama sizi çıktıdaki P değerine çok yaklaştırır. (Bildirilen T istatistiğinin değeri yuvarlanmışsa, P değeri tam olarak eşleşmeyebilir, ancak karar verme için yalnızca ilk ondalık basamak önemlidir.)
.
2 * (1 - pt(3.5714, 24))
[1] 0.001543522
- Sorularınızdan birini yorumlarda yanıtlamak için: Yazdırılan tablodan % 5 düzeyinde reddetme için kritik bir değerin olduğunu söyleyebilirsiniz.$c = 2.064.$ Yani% 5 seviyesinde reddedersiniz $|T| > 2.064,$hangisi. Kritik değer olasılığı azaltır$0.025 = 2.5\% $DF = 24 ile Student t dağılımının üst kuyruğundan.
qt
Bir kuantil fonksiyonun (ters CDF) olduğu R'de, aşağıda gösterildiği gibi% 5 kritik değeri elde edebilirsiniz. % 1 anlamlılık düzeyinde bir test için kritik değer nedir?
${}$
qt(.975, 24)
[1] 2.063899
Grafiksel özet. Aşağıdaki şekil Student t dağılımının 24 DF ile yoğunluk fonksiyonunu göstermektedir. Dikey mavi benzer, T istatistiğinin gözlemlenen değerini gösterir. P değeri, bu çizginin sağındaki eğrinin altındaki alanın iki katıdır. % 5 seviyesindeki bir test için alt ve üst kritik değerler dikey noktalı turuncu çizgilerle gösterilir; % 1 seviyesinde bir test için kırmızı çizgiler (daha uzak).