สถิติ - การทดสอบ Kolmogorov Smirnov

การทดสอบนี้ใช้ในสถานการณ์ที่ต้องทำการเปรียบเทียบระหว่างการแจกแจงตัวอย่างที่สังเกตได้และการแจกแจงตามทฤษฎี

การทดสอบตัวอย่าง KS One

การทดสอบนี้ใช้เป็นการทดสอบความพอดีและเหมาะอย่างยิ่งเมื่อขนาดของตัวอย่างมีขนาดเล็ก จะเปรียบเทียบฟังก์ชันการแจกแจงสะสมสำหรับตัวแปรที่มีการแจกแจงที่ระบุ สมมติฐานว่างถือว่าไม่มีความแตกต่างระหว่างการแจกแจงแบบสังเกตและเชิงทฤษฎีและค่าของสถิติทดสอบ 'D' คำนวณได้ดังนี้:

สูตร

$D = Maximum |F_o(X)-F_r(X)|$

ที่ไหน -

  • ${F_o(X)}$ = การแจกแจงความถี่สะสมที่สังเกตได้ของตัวอย่างการสังเกต n แบบสุ่ม

  • และ ${F_o(X) = \frac{k}{n}}$ = (จำนวนข้อสังเกต≤ X) / (จำนวนการสังเกตการณ์ทั้งหมด)

  • ${F_r(X)}$ = การแจกแจงความถี่เชิงทฤษฎี

ค่าวิกฤตของ ${D}$ พบได้จากค่าตาราง KS สำหรับการทดสอบตัวอย่างหนึ่งครั้ง

Acceptance Criteria: หากค่าที่คำนวณได้น้อยกว่าค่าวิกฤตให้ยอมรับสมมติฐานว่าง

Rejection Criteria: หากค่าที่คำนวณได้มากกว่าค่าตารางให้ปฏิเสธสมมติฐานว่าง

ตัวอย่าง

Problem Statement:

ในการศึกษาจากสตรีมต่างๆของนักศึกษา 60 คนโดยมีนักศึกษาจำนวนเท่ากันที่ดึงมาจากแต่ละสตรีมเราได้รับการสัมภาษณ์และมีการระบุความตั้งใจที่จะเข้าร่วม Drama Club ของวิทยาลัย

  วท.บ. ศ ธ บี. คอม MA พม
ไม่ได้ในแต่ละชั้นเรียน 5 9 11 16 19

คาดว่าจะมีนักเรียน 12 คนจากแต่ละชั้นเข้าร่วม Drama Club ใช้การทดสอบ KS เพื่อค้นหาว่ามีความแตกต่างระหว่างชั้นเรียนของนักเรียนหรือไม่เกี่ยวกับความตั้งใจในการเข้าร่วม Drama Club

Solution:

${H_o}$: ไม่มีความแตกต่างระหว่างนักเรียนในสตรีมที่แตกต่างกันเกี่ยวกับความตั้งใจในการเข้าร่วมชมรมการละคร

เราพัฒนาความถี่สะสมสำหรับการแจกแจงแบบสังเกตและเชิงทฤษฎี

สตรีม จำนวนนักเรียนที่สนใจเข้าร่วม ${F_O(X)}$ ${F_T(X)}$ ${|F_O(X)-F_T(X)|}$
  สังเกต
(O)
ทฤษฎี
(T)
     
วท.บ. 5 12 5/60 12/60 7/60
ศ ธ 9 12 14/60 24/60 10 ต.ค. 60
B.COM. 11 12 25/60 36/60 11/60
MA 16 12 41/60 48/60 7/60
M.COM 19 12 60/40 60/60 60/60
รวม n = 60        

ทดสอบสถิติ ${|D|}$ คำนวณเป็น:

$D = Maximum {|F_0 (X)-F_T (X)|} \\[7pt] \, = \frac{11}{60} \\[7pt] \, = 0.183$

ค่าตารางของ D ที่ระดับนัยสำคัญ 5% กำหนดโดย

${D_0.05 = \frac{1.36}{\sqrt{n}}} \\[7pt] \, = \frac{1.36}{\sqrt{60}} \\[7pt] \, = 0.175$

เนื่องจากค่าที่คำนวณได้มากกว่าค่าวิกฤตดังนั้นเราจึงปฏิเสธสมมติฐานว่างและสรุปได้ว่ามีความแตกต่างระหว่างนักเรียนในสตรีมที่แตกต่างกันในความตั้งใจที่จะเข้าร่วมคลับ

KS สองตัวอย่างการทดสอบ

เมื่อแทนที่จะเป็นหนึ่งจะมีตัวอย่างอิสระสองตัวอย่างจากนั้นสามารถใช้การทดสอบตัวอย่าง KS สองตัวอย่างเพื่อทดสอบข้อตกลงระหว่างการแจกแจงสะสมสองแบบ สมมติฐานว่างระบุว่าไม่มีความแตกต่างระหว่างการแจกแจงทั้งสอง D-statistic คำนวณในลักษณะเดียวกับ KS One Sample Test

สูตร

${D = Maximum |{F_n}_1(X)-{F_n}_2(X)|}$

ที่ไหน -

  • ${n_1}$ = การสังเกตจากตัวอย่างแรก

  • ${n_2}$ = การสังเกตจากตัวอย่างที่สอง

จะเห็นได้ว่าเมื่อการแจกแจงสะสมแสดงค่าเบี่ยงเบนสูงสุดมาก ${|D|}$ มันบ่งบอกถึงความแตกต่างระหว่างการแจกแจงตัวอย่างทั้งสอง

ค่าวิกฤตของ D สำหรับตัวอย่างที่ ${n_1 = n_2}$และคือ≤ 40 ใช้ตาราง KS สำหรับสองกรณีตัวอย่าง เมื่อไหร่${n_1}$ และ / หรือ ${n_2}$> 40 จากนั้นควรใช้ตาราง KS สำหรับตัวอย่างขนาดใหญ่ของการทดสอบสองตัวอย่าง สมมติฐานว่างเป็นที่ยอมรับหากค่าที่คำนวณได้น้อยกว่าค่าตารางและในทางกลับกัน

ดังนั้นการใช้การทดสอบแบบไม่ใช้พารามิเตอร์เหล่านี้จะช่วยให้นักวิจัยสามารถทดสอบความสำคัญของผลลัพธ์เมื่อไม่ทราบลักษณะของประชากรเป้าหมายหรือไม่มีการตั้งสมมติฐานเกี่ยวกับพวกเขา