Küçük numune boyutları için neden kesin testler ki-kare yerine tercih edilir?

Aug 18 2020

Grupların homojenliğini test etmeye çalışırken, bir beklenmedik durum tablosunda beklenen değerleriniz düşükse, Fisher'in kesin testi gibi testlerin bazen ki-kare yerine tercih edilebilir olduğunun farkındayım (tarihsel olarak insanlar 5'i önerdi, ancak bazıları bunun muhafazakar olduğunu düşünüyor) .

Bununla birlikte, chi-kare'nin neden küçük örneklem boyutları için iyi çalışmadığına dair bir açıklama bulamıyorum. Bu nedenle 2 sorum var:

  1. Bir acil durum tablosundaki beklenen değerlerin, örneklem boyutu azaldıkça küçük olmasına ne sebep olur? (Burada beklenen küçük değerlerin küçük örneklem boyutunun bir sonucu olduğunu varsayıyorum).
  2. Neden ki-kare testi küçük numune boyutları için kullanılmamalıdır? İnsanların teorik ki-kare dağılımına yeterince yaklaşmadığını söylediklerini gördüm, ancak birisi neden / nasıl olmadığını açıklayabilir mi?

Yanıtlar

12 Ben Aug 18 2020 at 07:24

Klasik bir hipotez testinde, kanıtı boş hipoteze en elverişli olandan alternatif hipoteze en uygun olana sıralayan bir test istatistiğiniz vardır. (Genelliği kaybetmeden, bu istatistiğin daha yüksek bir değerinin alternatif hipoteze daha elverişli olduğunu varsayalım.) Testin p-değeri , gerçekte gözlemlediğiniz gibi, en azından alternatif hipoteze elverişli olan kanıtı gözlemleme olasılığıdır ( sıfır hipotezinin doğru olduğu varsayımı altında en az gözlenen değer kadar büyük bir test istatistiği. Bu, sıfır hipotezinin doğru olduğu varsayımına göre dağılımı olan test istatistiğinin boş dağılımından hesaplanır .

Şimdi, "kesin test", p değerini tam olarak hesaplayan bir testtir - yani, bunu test istatistiğinin gerçek boş dağılımından hesaplar . Birçok istatistiksel testte, gerçek boş dağılım karmaşıktır, ancak başka bir dağılımla yaklaşık olarak tahmin edilebilir ve bu yaklaşık dağılıma şu şekilde yakınsar:$n \rightarrow \infty$. Özellikle, "ki-kare testleri" denen testler, gerçek sıfır dağılımın bir ki-kare dağılımına yakınsadığı hipotez testleridir.

Yani, bu tür bir "ki-kare testinde", ki-kare dağılımını kullanarak testin p değerini hesapladığınızda, bu sadece gerçek p-değerine bir yaklaşımdır . Testin gerçek p değeri, kesin test tarafından verilir ve bu değeri, test istatistiğinin yaklaşık sıfır dağılımını kullanarak tahmin edersiniz. Ne zaman$n$ büyükse bu yaklaşım çok iyidir, ancak $n$küçükse, yaklaşım zayıf olabilir. Bu nedenle, istatistikçiler "ki-kare testlerinin" kullanılmaması (yani, gerçek sıfır dağılımına ki-kare yaklaşımının kullanılması)$n$ küçük.


Olasılık tablolarında bağımsızlık için ki-kare testleri : Şimdi, olasılık tablolarında bağımsızlığı test etmek için ki-kare testleriyle ilgili özel sorularınızı inceleyeceğim. Bu bağlamda, gözlemlenen sayımlara sahip bir acil durum tablomuz varsa$O_1,...,O_K$ özetlemek $n \equiv \sum O_i$ daha sonra test istatistiği Pearson istatistiğidir:

$$\chi^2 = \sum_{i=1}^K \frac{(O_i-E_i)^2}{E_i},$$

nerede $E_1,...,E_K$ boş hipotez altında beklenen hücre değerleridir.$^\dagger$ Burada dikkat edilmesi gereken ilk şey, gözlemlenen sayının $O_1,...,O_K$negatif olmayan tam sayılardır. Herhangi$n<\infty$bu, test istatistiğinin olası değerlerini sonlu bir olası değerler kümesiyle sınırlar, bu nedenle gerçek sıfır dağılımı, bu sonlu değerler kümesi üzerinde ayrık bir dağılım olacaktır. Ki-kare dağılımı o Not olamaz hepsi negatif olmayan reel sayılar --- değerlerin (sayılamayan) sonsuz kümesi üzerinden sürekli bir dağılım olduğu için gerçek boş dağıtım ol.

Diğer "ki-kare testlerinde" olduğu gibi, buradaki test istatistiğinin sıfır dağılımı, ne zaman ki-kare dağılımı ile çok iyi tahmin edilir $n$büyük. Bunun "teorik ki-kare dağılımına yeterince yaklaşamama" meselesi olduğunu söylemek doğru değil - tersine, teorik ki-kare dağılımı yaklaşıktır , gerçek sıfır dağılım değil. Ki-kare yaklaşımı, değerlerin hiçbiri olmadığı sürece iyidir$E_1,...,E_K$küçük. Bu beklenen değerlerin düşük değerler için küçük olmasının nedeni$n$ Toplam sayım değeri düşük olduğunda, en azından bazı hücrelerdeki sayımların düşük olmasını beklemeniz gerektiğidir.


$^\dagger$Olasılık tablolarının analizi için, bu beklenen hücre sayıları, sıfır bağımsızlık hipotezi altında marjinal toplamlar üzerinde koşullandırılarak elde edilir. Bu değerler hakkında daha fazla detaya girmemize gerek yoktur.