統計-コルモゴロフスミルノフ検定
この検定は、観測されたサンプル分布と理論上の分布を比較する必要がある状況で使用されます。
KSワンサンプルテスト
この検定は適合度の検定として使用され、サンプルのサイズが小さい場合に理想的です。変数の累積分布関数を指定された分布と比較します。帰無仮説は、観測された分布と理論上の分布の間に差がないと仮定し、検定統計量「D」の値は次のように計算されます。
式
$D = Maximum |F_o(X)-F_r(X)|$
ここで-
${F_o(X)}$ = n個の観測値のランダムサンプルの観測された累積度数分布。
そして ${F_o(X) = \frac{k}{n}}$ =(観測数≤X)/(観測の総数)。
${F_r(X)}$ =理論的な度数分布。
の臨界値 ${D}$ 1つのサンプルテストのKSテーブル値から検出されます。
Acceptance Criteria: 計算値が臨界値よりも小さい場合は、帰無仮説を受け入れます。
Rejection Criteria: 計算された値がテーブルの値より大きい場合、帰無仮説を棄却します。
例
Problem Statement:
大学のさまざまなストリームから行われた調査では、各ストリームから同数の学生が引き出された60人の学生がインタビューを受け、大学のドラマクラブに参加する意向が示されました。
理学士 | BA | B.Com | MA | M.Com | |
---|---|---|---|---|---|
各クラスの番号 | 5 | 9 | 11 | 16 | 19 |
各クラスから12人の生徒がドラマクラブに参加することが期待されていました。KSテストを使用して、ドラマクラブに参加する意図に関して生徒のクラス間に違いがあるかどうかを確認します。
Solution:
${H_o}$:ドラマクラブに参加する意図に関して、異なるストリームの学生の間で違いはありません。
観測分布と理論分布の累積度数を作成します。
ストリーム | 参加に興味のある学生の数 | ${F_O(X)}$ | ${F_T(X)}$ | ${|F_O(X)-F_T(X)|}$ | |
---|---|---|---|---|---|
観察された (O) |
理論的 (T) |
||||
理学士 | 5 | 12 | 5/60 | 12/60 | 7/60 |
BA | 9 | 12 | 14/60 | 24/60 | 10/60 |
B.COM。 | 11 | 12 | 25/60 | 36/60 | 11/60 |
MA | 16 | 12 | 41/60 | 48/60 | 7/60 |
M.COM。 | 19 | 12 | 60/40 | 60/60 | 60/60 |
合計 | n = 60 | ||||
検定統計量 ${|D|}$ 次のように計算されます:
5%の有意水準でのDのテーブル値は、次の式で与えられます。
計算された値は臨界値よりも大きいため、帰無仮説を棄却し、クラブに参加する意図に異なるストリームの学生間で違いがあると結論付けます。
KS2サンプルテスト
1つではなく2つの独立したサンプルがある場合、KS 2サンプルテストを使用して、2つの累積分布間の一致をテストできます。帰無仮説は、2つの分布の間に差がないことを示しています。D統計は、KSOneサンプルテストと同じ方法で計算されます。
式
${D = Maximum |{F_n}_1(X)-{F_n}_2(X)|}$
ここで-
${n_1}$ =最初のサンプルからの観察。
${n_2}$ = 2番目のサンプルからの観測。
累積分布が大きな最大偏差を示す場合、 ${|D|}$ これは、2つのサンプル分布の違いを示しています。
サンプルのDの臨界値 ${n_1 = n_2}$≤40の場合、2つのサンプルケースのKSテーブルが使用されます。いつ${n_1}$ および/または ${n_2}$> 40の場合、2つのサンプルテストの大きなサンプルのKSテーブルを使用する必要があります。計算された値がテーブルの値よりも小さい場合はnull仮説が受け入れられ、その逆も同様です。
したがって、これらのノンパラメトリック検定のいずれかを使用すると、研究者は、対象母集団の特性が不明であるか、それらについて仮定が行われていない場合に、結果の有意性を検定するのに役立ちます。