Neden küçük $p$-value, null ile uyumsuzluğu gösterir?
Basit bir örnek olarak, popülasyon ortalamasına ilişkin iki kuyruklu tek örneklem hipotez testini ele alalım. Bir belirlediğimizi varsayalım$\alpha$-düzey a priori.
İzin Vermek $X_1, \dots, X_n \overset{\text{iid}}{\sim}\mathcal{N}(\mu, \sigma^2)$. Bu ayarda bir değer verildiğinde$\mu_0$boş ve alternatif hipotezlerimiz var $H_0: \mu = \mu_0$ ve $H_1: \mu \neq \mu_0$.
İzin Vermek $\bar{X}_n$ örnek anlamı olmak $X_1, \dots, X_n$ ve $S^2$ tarafsız tahmincisi olmak $\sigma^2$, ile $\bar{x}_n$ ve $s^2$ gözlemlenen değerler olmak.
Biz biliyoruz ki $$\dfrac{\bar{X}_n - \mu}{\sqrt{S^2/n}} \sim t_{n-1}$$ yani, bir $t$ile dağıtım $n-1$özgürlük derecesi. Altında$H_0$bizde var $$\dfrac{\bar{X}_n - \mu_0}{\sqrt{S^2/n}} \sim t_{n-1}\text{.}$$ Sonra a hesaplıyoruz $p$-değer $$p = \mathbb{P}\left(|T| \geq \dfrac{\bar{x}_n - \mu_0}{\sqrt{s^2/n}} \right)$$ nerede $T \sim t_{n-1}$ ve eğer $p < \alpha$reddediyoruz $H_0$ ve kanıt olduğunu belirtin $H_1$.
Şimdi, bu prosedürü yıllardır uyguluyorum ve bunu sormaktan biraz utanıyorum, çünkü yüksek lisans derecem var: ama tam olarak neden$p < \alpha$ ile uyumsuzluğu belirtmek $H_0$ ve için kanıt $H_1$? Matematiksel olarak, günün sonunda olan tek şey, rastgele değişkeninizin$T$en azından örnek tarafından elde edilenden daha uç (mutlak değer olarak) bir değer alır. Ama neden sahip olduğumu göremiyorum$p < \alpha$ reddedecek kanıtımız olduğunu gösterir $H_0$.
Belki bu Casella ve Berger'de ele alınmış olabilir ve ayrıntıları unutmuşum.
Yanıtlar
Bir benzetme kullanalım.
Hangi gün olduğu konusunda kafanız karışık. Daha da kötüsü, yaz olabileceğine dair bir önseziniz olmasına rağmen ayı bile bilmiyorsunuz, ancak kış olmasını istiyorsunuz (yani$H_0: \text{summer}$ ve $H_a: \text{winter}$). Telefonunuzdaki takvime güvenmiyorsunuz, ancak hava durumu uygulamasına güveniyorsunuz, bu yüzden sıcaklığı kontrol ediyorsunuz.
Hava durumu uygulamasının sıcaklığı şu şekilde rapor ettiğini görüyorsunuz: $-24^{\circ} C$.
Yaz aylarında bu kadar soğuk ya da soğuk olmanın pek olası olmadığını biliyorsunuz, bu nedenle kış olduğu sonucuna varmak adına yaz olduğu fikrini reddediyorsunuz.
Bu benzetmede, yeterince küçük veren kritik değer $p <\alpha$ Önsezinizden o kadar şüphe duyacağınız sıcaklıktır ki yaz geldiğinden "Hayır, kış zamanı!"
Ben her zaman p-değerini bir anormalliğin göstergesi olarak görüyorum : Olası olmayan aşırı bir gözlem (ne kadar olası değil, p-değeri ile gösterilir).
Boş teori ve gözlem arasındaki tüm tutarsızlıklar, boş ile uyumsuzluğun güçlü bir göstergesi değildir. Gürültü veya diğer ölçüm varyasyonları nedeniyle, bir miktar tutarsızlık olması beklenir ve muhtemelen belli bir aralıkta bir gözlem elde edilir.
Ancak, olası aralığın dışındaki büyük tutarsızlıklar beklenmediktir. Bu tür tutarsızlıklar, sıfır teorisinin yanlış olabileceğinin bir göstergesidir. Tutarsızlık ne kadar beklenmedik olursa (p değeri ne kadar düşükse) o kadar güçlü, boş teorinin gözlemlerle uyumsuz olduğunu gösterir.
Bir teoriyi test ederken, teori ve gözlem arasındaki bir tutarsızlığa bakarak, tipik olarak sadece çok olası olmayan tutarsızlıklarla ilgileniyoruz.
Açıkçası, herhangi p -değeri olan bazı ilgili kanıtlar$H_0$ vs. $H_1$soru. Genellikle karar verme aşamasına gelir: Bunu varsayarsak harekete geçmeli (veya gelecekteki eylemlerinizi planlamalı) mısınız$H_0$ doğru mu yoksa tutmalısın $H_1$doğru için? Ampirik bir alanda asla kesin olarak bilemezsiniz, ama yine de bir şekilde karar vermelisiniz.
Şimdi, bu kararı vermek için olasılığın tek başına doğru kriter olup olmadığı farklı bir soru, ama öyle olduğunu varsayalım. Ardından, ayarlayarak$\alpha$bir değerde (genellikle 0,05) temelde bir karar sınırı oluşturuyorsunuz: p- değeri bunun altındaysa, sanki$H_1$doğruydu, çünkü bu kadar aşırı bir değer elde etmek yeterince olası değil (yine de mümkün olsa da)$T$ Eğer $H_0$ haklıydın.
Örneğin:
1 milyon 1 bin sipariş ettiğinizi varsayın$\Omega$bir elektronik bileşen üreticisinin dirençleri. Üretim süreci nedeniyle hiçbir direnç tam olarak 1 k değildir$\Omega$, yani gerçek direnç, bu değerin etrafındaki bazı rastgele dağılımlardır. Her bir direnci kendiniz kontrol edecek kaynaklara sahip değilsiniz, ancak bir örnek alabilir, üzerindeki direnci ölçebilir ve istatistikleri yapabilirsiniz.
Yeterince büyük bir p değeri alırsanız ,$p \gt \alpha$, söyleyebilirsin:
Nüfustaki gerçek direncin 1 olduğunu varsayarsak$k\Omega$Ortalama direnci en azından bu ideal değerden ölçüldüğü kadar sapan rastgele bir örnek almak makul bir olasılıktır . Gönderiyi kabul edip dirençleri ürünüme yerleştireceğim.
Bu reddetmek için başarısız $H_0$. Öte yandan, p değeriniz, değerinizin altındaysa$\alpha$gerekçeniz şudur:
Nüfustaki gerçek direncin 1 olduğunu varsayarsak$k\Omega$Ortalama direnci en azından bu ideal değerden ölçüldüğü kadar sapan rastgele bir örnek almak çok olası değildir . Dolayısıyla, gerçek direnç muhtemelen 1 değil$k\Omega$. Ben daha güvenilir biri ya da her türlü aramak, üreticiye dava, sevkiyat reddetmek edeceğiz ama olacak değil o yanlış boyutlandırılmış bileşenlerle düzgün çalışması için gitmiyor, çünkü benim üründe bu dirençler kullanın.
Bu reddediyor $H_0$ lehine $H_1$.