どのようにすることができます $t$-統計は仮説をテストするために使用されますか?
次の質問があります。正規分布からのサイズ25のランダムサンプルの平均は47、標準偏差は7です。 $t$-統計、与えられた情報は、母集団の平均が42であるという推測を裏付けていると言えますか?
私は本当に混乱しています $t$-統計は、仮説を棄却するか、棄却しないように機能します。説明は本当に役に立ちます。ありがとう!
回答
両面1サンプルT検定
たまたま通常のデータセットがあります $n=25, \bar X = 57, S = 7$ Rセッションウィンドウで。
データはテストに適していますか?Rによって計算されたデータの要約は次のとおりです。
summary(x)
Min. 1st Qu. Median Mean 3rd Qu. Max.
35.18 40.78 44.83 47.00 52.35 61.34
length(x); sd(x)
[1] 25 # sample size n = 25
[1] 7 # sample standard deviation S = 7.0
stripchart(x, pch="|")
遠い外れ値のないほぼ対称的なデータ。上記のP値でシャピロ-ウィルク正規性検定に合格$0.05 = 5\%.$
shapiro.test(x)
Shapiro-Wilk normality test
data: x
W = 0.96136, p-value = 0.4423
データは、テストで有効になるのに十分なほど正常に近いです。
t検定のRプリントアウト。したがって、ここでは、1サンプルのt検定のRから出力されます。$H_0: \mu = 42$ に対して $H_a: \mu \ne 42.$
t.test(x, mu=42)
One Sample t-test
data: x
t = 3.5714, df = 24, p-value = 0.001543
alternative hypothesis:
true mean is not equal to 42
95 percent confidence interval:
44.11054 49.88946
sample estimates:
mean of x
47
出力の解釈。P値は$0.0015 < 0.05 = 5\%,$ だからあなたは拒否するでしょう $H_0$5%の有意水準で。1%レベルで拒否することもできます。
出力は、95%の信頼区間(CI)も示します。 $(44.11, 49.89),$ の真の価値を結論付けることができます $\mu$その間隔にあります-含まれていません$\mu = 42.$
このCIの1つの解釈は、データに基づく「拒否できない」帰無仮説の間隔であるというものです。
テストについて知っておくべき詳細。@PeterForemanは、T統計量を計算する方法を示しています。P値を除いて、手動計算によって出力内の他のすべてを再現できるはずです。
正確なP値は、コンピューターのプリントアウトに記載されています。tの印刷された表を見ると、P値を「括弧で囲む」ことができるはずです。たとえば、私のテーブルの行DF = 24には値2.467と3.745があり、T統計量3.5714を囲んでいます。テーブルの上部マージンを見ると、P値は$2(0.001) = 0.002$ そして $2(0.0005) = 0.001,$これはRの値と一致します。[
2
これは両側t検定であるためです。]この両側検定の正確なP値は、Rまたは他の統計ソフトウェアで取得できます。これは、T統計量がより遠い確率です。$0$ 観察されたより $T =3.5714.$
pt
スチューデントのt分布のCDFであるRでは、次の計算により、印刷出力のP値に非常に近くなります。(報告されたT統計量の値が四捨五入されている場合、P値は正確に一致しない可能性がありますが、意思決定には小数点以下2桁のみが重要です。)
。
2 * (1 - pt(3.5714, 24))
[1] 0.001543522
- コメントであなたの質問の1つに答えるには:印刷されたt表から、5%レベルで拒否するための臨界値は次のようになります。$c = 2.064.$ つまり、5%レベルで拒否します $|T| > 2.064,$それです。臨界値は確率を削減します$0.025 = 2.5\% $DF = 24のスチューデントのt分布の上部テールから。
qt
が分位関数(逆CDF)であるRで、以下に示すように5%の臨界値を取得できます。1%の有意水準でのテストの臨界値は何ですか?
${}$
qt(.975, 24)
[1] 2.063899
グラフィカルな要約。次の図は、24DFのスチューデントのt分布の密度関数を示しています。のような縦の青いは、T統計量の観測値を示しています。P値は、この線の右側の曲線の下の面積の2倍です。5%レベルでのテストの下限と上限の臨界値は、オレンジ色の縦の点線で示されています。1%レベルでのテストの赤い線(さらに外側)。