なぜ小さいのですか $p$-値はnullとの非互換性を示しますか?
簡単な例として、母平均の両側1標本仮説検定を取り上げましょう。決定したとしましょう$\alpha$-アプリオリを平準化する。
しましょう $X_1, \dots, X_n \overset{\text{iid}}{\sim}\mathcal{N}(\mu, \sigma^2)$。この設定では、値を指定します$\mu_0$、帰無仮説と対立仮説があります $H_0: \mu = \mu_0$ そして $H_1: \mu \neq \mu_0$。
しましょう $\bar{X}_n$ のサンプル平均である $X_1, \dots, X_n$ そして $S^2$ の不偏推定量になる $\sigma^2$、と $\bar{x}_n$ そして $s^2$ 観測値です。
私達はことを知っています $$\dfrac{\bar{X}_n - \mu}{\sqrt{S^2/n}} \sim t_{n-1}$$ すなわち、 $t$-との配布 $n-1$自由度。下$H_0$、私たちはそれを持っています $$\dfrac{\bar{X}_n - \mu_0}{\sqrt{S^2/n}} \sim t_{n-1}\text{.}$$ 次に、 $p$-値 $$p = \mathbb{P}\left(|T| \geq \dfrac{\bar{x}_n - \mu_0}{\sqrt{s^2/n}} \right)$$ どこ $T \sim t_{n-1}$ で、もし $p < \alpha$、拒否します $H_0$ との証拠があると述べます $H_1$。
今、私は何年もこの手順を行ってきた、と私はMSの学位を保持することを考えると、これを尋ねるために少し恥ずかしい:しかし、正確な理由持つん$p < \alpha$ との非互換性を示します $H_0$ との証拠 $H_1$?数学的には、1日の終わりにあるのは、確率変数が$T$少なくともサンプルによって生成された値と同じくらい極端な値(絶対値)を取ります。しかし、私はなぜ持っているのかわかりません$p < \alpha$ 拒否する証拠があることを示します $H_0$。
おそらくこれはカゼッラとバーガーでカバーされていたかもしれません、そして私は詳細を忘れました。
回答
例えを使ってみましょう。
あなたはそれが何日であるかについて混乱して目を覚ます。さらに悪いことに、あなたは月がわからないのですが、それは夏かもしれないという予感がありますが、あなたはそれを冬にしたいのです($H_0: \text{summer}$ そして $H_a: \text{winter}$)。スマートフォンのカレンダーは信頼できませんが、天気アプリは信頼できるので、気温を確認します。
天気アプリが気温を次のように報告していることがわかります $-24^{\circ} C$。
夏の間、それほど寒くなることはほとんどないことを知っているので、夏であるという考えを拒否し、冬であると結論付けることにします。
この例えでは、臨界値は十分に小さい $p <\alpha$ は、あなたが自分の予感を疑うほど夏になる温度であり、「いや、冬の時間だ!」と結論付けるでしょう。
私は常にp値を異常の指標として見ています:ありそうもない極端な観察(どれほどありそうもない、それはp値によって示されます)。
ヌル理論と観測の間のすべての不一致がヌルとの非互換性の強力な指標であるわけではありません。ノイズやその他の測定のばらつきのために、ある程度の不一致が予想され、ある程度の範囲内で観測が得られる可能性があります。
ただし、予想される範囲外の大きな差異は予想外です。このような不一致は、ヌル理論が正しくない可能性があることを示しています。不一致が予想外であるほど(p値が低いほど)、ヌル理論が観測値と互換性がないことを示します。
理論をテストするとき、理論と観察の間の不一致を調べることによって、私たちは通常、非常にありそうもない不一致にのみ関心があります。
厳密に言えば、任意のp個の-値は、いくつかに関する証拠$H_0$ 対。 $H_1$質問。それは通常、意思決定に要約されます。次のことを前提として行動する(または将来の行動を計画する)必要があります。$H_0$ 本当です、またはあなたが保持する必要があります $H_1$本当ですか?経験的な分野では、絶対に確実に知ることはできませんが、それでも、何らかの方法で決定を下す必要があります。
さて、確率自体がその決定を下すための正しい基準であるかどうかは別の問題ですが、そうであると仮定しましょう。次に、設定することにより$\alpha$ある値(通常は0.05)まで、基本的に決定境界を確立しています。p値がそれを下回っている場合は、次のように動作することを決定します。$H_1$そのような極端な値を取得することは(まだ可能ですが)十分にありそうもないので、本当でした$T$ もし $H_0$ 正しかった。
例えば:
1kを100万個注文したと仮定します$\Omega$電子部品メーカーの抵抗器。製造工程により、正確に1kの抵抗はありません$\Omega$したがって、真の抵抗はその値の周りのランダムな分布です。各抵抗器を自分でチェックするためのリソースはありませんが、サンプルを取り、抵抗器の抵抗を測定して統計を行うことができます。
十分に大きなp値が得られた場合、$p \gt \alpha$、あなたは言うことができます:
人口の真の抵抗が1であると仮定します$k\Omega$、平均抵抗が少なくともその理想値から測定された量だけ逸脱しているランダムサンプルを抽出する可能性はかなりあります。出荷を受け入れ、抵抗器を製品に組み込みます。
これは拒否に失敗しています $H_0$。一方、p値が$\alpha$、あなたの推論は次のとおりです。
人口の真の抵抗が1であると仮定します$k\Omega$、平均抵抗が少なくともその理想値から測定された量だけ逸脱しているランダムサンプルを取得することは非常にありそうにありません。したがって、真の抵抗はおそらく1ではありません$k\Omega$。私は、より信頼性の高い1または何を検索し、メーカーを訴える、出荷を拒否するだろうが、私はなりません、誤って寸法の部品で正しく動作するつもりはないので、私の製品では、これらの抵抗器を使用しています。
これは拒否しています $H_0$ に賛成 $H_1$。