どのようにすることができます $t$-統計は仮説をテストするために使用されますか?

Aug 15 2020

次の質問があります。正規分布からのサイズ25のランダムサンプルの平均は47、標準偏差は7です。 $t$-統計、与えられた情報は、母集団の平均が42であるという推測を裏付けていると言えますか?

私は本当に混乱しています $t$-統計は、仮説を棄却するか、棄却しないように機能します。説明は本当に役に立ちます。ありがとう!

回答

2 BruceET Aug 16 2020 at 01:35

両面1サンプルT検定

たまたま通常のデータセットがあります $n=25, \bar X = 57, S = 7$ Rセッションウィンドウで。

データはテストに適していますか?Rによって計算されたデータの要約は次のとおりです。

summary(x)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  35.18   40.78   44.83   47.00   52.35   61.34 
length(x); sd(x)
[1] 25   # sample size n = 25
[1] 7    # sample standard deviation S = 7.0

stripchart(x, pch="|")

遠い外れ値のないほぼ対称的なデータ。上記のP値でシャピロ-ウィルク正規性検定に合格$0.05 = 5\%.$

shapiro.test(x)

        Shapiro-Wilk normality test

data:  x
W = 0.96136, p-value = 0.4423

データは、テストで有効になるのに十分なほど正常に近いです。

t検定のRプリントアウト。したがって、ここでは、1サンプルのt検定のRから出力されます。$H_0: \mu = 42$ に対して $H_a: \mu \ne 42.$

t.test(x, mu=42)

        One Sample t-test

data:  x
t = 3.5714, df = 24, p-value = 0.001543
alternative hypothesis: 
  true mean is not equal to 42
95 percent confidence interval:
  44.11054 49.88946
sample estimates:
mean of x 
       47 

出力の解釈。P値は$0.0015 < 0.05 = 5\%,$ だからあなたは拒否するでしょう $H_0$5%の有意水準で。1%レベルで拒否することもできます。

出力は、95%の信頼区間(CI)も示します。 $(44.11, 49.89),$ の真の価値を結論付けることができます $\mu$その間隔にあります-含まれていませ$\mu = 42.$

このCIの1つの解釈は、データに基づく「拒否できない」帰無仮説の間隔であるというものです。

テストについて知っておくべき詳細。@PeterForemanは、T統計量を計算する方法を示しています。P値を除いて、手動計算によって出力内の他のすべてを再現できるはずです。

  • 正確なP値は、コンピューターのプリントアウトに記載されています。tの印刷された表を見ると、P値を「括弧で囲む」ことができるはずです。たとえば、私のテーブルの行DF = 24には値2.467と3.745があり、T統計量3.5714を囲ん​​でいます。テーブルの上部マージンを見ると、P値は$2(0.001) = 0.002$ そして $2(0.0005) = 0.001,$これはRの値と一致します。[2これは両側t検定であるためです。]

  • この両側検定の正確なP値は、Rまたは他の統計ソフトウェアで取得できますこれは、T統計量がより遠い確率です。$0$ 観察されたより $T =3.5714.$ptスチューデントのt分布のCDFであるRでは、次の計算により、印刷出力のP値に非常に近くなります。(報告されたT統計量の値が四捨五入されている場合、P値は正確に一致しない可能性がありますが、意思決定には小数点以下2桁のみが重要です。)

2 * (1 - pt(3.5714, 24))
[1] 0.001543522
  • コメントであなたの質問の1つに答えるには:印刷されたt表から、5%レベルで拒否するための臨界値は次のようになります。$c = 2.064.$ つまり、5%レベルで拒否します $|T| > 2.064,$それです。臨界値は確率を削減します$0.025 = 2.5\% $DF = 24のスチューデントのt分布の上部テールから。qtが分位関数(逆CDF)であるRで、以下に示すように5%の臨界値を取得できます。1%の有意水準でのテストの臨界値は何ですか?

${}$

qt(.975, 24)
[1] 2.063899

グラフィカルな要約。次の図は、24DFのスチューデントのt分布の密度関数を示しています。のような縦の青いは、T統計量の観測値を示しています。P値は、この線の右側の曲線の下の面積の2倍です。5%レベルでのテストの下限と上限の臨界値は、オレンジ色の縦の点線で示されています。1%レベルでのテストの赤い線(さらに外側)。