İstatistik - Kolmogorov Smirnov Testi

Bu test, gözlemlenen bir numune dağılımı ile teorik dağılım arasında bir karşılaştırma yapılması gereken durumlarda kullanılır.

KS Bir Numune Testi

Bu test, bir uyum iyiliği testi olarak kullanılır ve numunenin boyutu küçük olduğunda idealdir. Bir değişken için kümülatif dağılım işlevini belirli bir dağılımla karşılaştırır. Boş hipotez, gözlemlenen ve teorik dağılım arasında hiçbir fark olmadığını varsayar ve test istatistiği 'D' değeri şu şekilde hesaplanır:

Formül

$D = Maximum |F_o(X)-F_r(X)|$

Nerede -

  • ${F_o(X)}$ = Rastgele n gözlem örneğinin gözlemlenen kümülatif frekans dağılımı.

  • ve ${F_o(X) = \frac{k}{n}}$ = (Gözlem sayısı ≤ X) / (Toplam gözlem sayısı).

  • ${F_r(X)}$ = Teorik frekans dağılımı.

Kritik değeri ${D}$ bir örnek test için KS tablo değerlerinden bulunur.

Acceptance Criteria: Hesaplanan değer kritik değerden düşükse, sıfır hipotezi kabul edin.

Rejection Criteria: Hesaplanan değer tablo değerinden büyükse boş hipotezi reddedin.

Misal

Problem Statement:

Bir üniversitenin 60 öğrencinin çeşitli akışlarından yapılan ve her bir akıştan eşit sayıda öğrenci ile yapılan bir çalışmada mülakat yapıldı ve kolejin Drama Kulübü'ne katılma niyetleri not edildi.

  B.Sc. BA B.Com MA M.Com
Her sınıfta hayır 5 9 11 16 19

Drama Kulübü'ne her sınıftan 12 öğrencinin katılması bekleniyordu. Drama Kulübüne katılma niyetleri açısından öğrenci sınıfları arasında herhangi bir fark olup olmadığını bulmak için KS testini kullanmak.

Solution:

${H_o}$: Drama kulübüne katılma niyetleri açısından farklı akımlardan öğrenciler arasında bir fark yoktur.

Gözlemlenen ve teorik dağılımlar için kümülatif frekansları geliştiriyoruz.

Canlı Yayınlar Katılmakla ilgilenen öğrenci sayısı ${F_O(X)}$ ${F_T(X)}$ ${|F_O(X)-F_T(X)|}$
  Gözlemlenen
(O)
Teorik
(T)
     
B.Sc. 5 12 5/60 12/60 7/60
BA 9 12 14/60 24/60 10/60
B.COM. 11 12 25/60 36/60 11/60
MA 16 12 41/60 48/60 7/60
M.COM. 19 12 60/40 60/60 60/60
Toplam n = 60        

Test istatistiği ${|D|}$ şu şekilde hesaplanır:

$D = Maximum {|F_0 (X)-F_T (X)|} \\[7pt] \, = \frac{11}{60} \\[7pt] \, = 0.183$

D'nin% 5 anlamlılık düzeyindeki tablo değeri,

${D_0.05 = \frac{1.36}{\sqrt{n}}} \\[7pt] \, = \frac{1.36}{\sqrt{60}} \\[7pt] \, = 0.175$

Hesaplanan değer kritik değerden daha büyük olduğu için, boş hipotezi reddediyoruz ve farklı akımlardan gelen öğrenciler arasında Kulübe katılma niyetlerinde bir fark olduğu sonucuna varıyoruz.

KS İki Örnek Testi

Bir yerine iki bağımsız örnek olduğunda, iki kümülatif dağılım arasındaki uyumu test etmek için KS iki örnek testi kullanılabilir. Boş hipotez, iki dağılım arasında hiçbir fark olmadığını belirtir. D-istatistiği, KS Tek Numune Testi ile aynı şekilde hesaplanır.

Formül

${D = Maximum |{F_n}_1(X)-{F_n}_2(X)|}$

Nerede -

  • ${n_1}$ = İlk numuneden alınan gözlemler.

  • ${n_2}$ = İkinci numuneden alınan gözlemler.

Kümülatif dağılımların büyük maksimum sapma gösterdiği görülmüştür. ${|D|}$ iki örnek dağılım arasındaki farklılığa işaret ediyor.

Örnekler için kritik D değeri ${n_1 = n_2}$ve ≤ 40 ise, iki örnek durum için KS tablosu kullanılır. Ne zaman${n_1}$ ve / veya ${n_2}$> 40 ise iki örnek testin büyük örnekleri için KS tablosu kullanılmalıdır. Hesaplanan değer tablo değerinden düşükse ve tersi durumda boş hipotez kabul edilir.

Bu nedenle, bu parametrik olmayan testlerden herhangi birinin kullanılması, bir araştırmacının, hedef popülasyonun özellikleri bilinmediğinde veya bunlar hakkında hiçbir varsayımda bulunulmadığında sonuçlarının önemini test etmesine yardımcı olur.