สถิติ - การทดสอบ Kolmogorov Smirnov
การทดสอบนี้ใช้ในสถานการณ์ที่ต้องทำการเปรียบเทียบระหว่างการแจกแจงตัวอย่างที่สังเกตได้และการแจกแจงตามทฤษฎี
การทดสอบตัวอย่าง KS One
การทดสอบนี้ใช้เป็นการทดสอบความพอดีและเหมาะอย่างยิ่งเมื่อขนาดของตัวอย่างมีขนาดเล็ก จะเปรียบเทียบฟังก์ชันการแจกแจงสะสมสำหรับตัวแปรที่มีการแจกแจงที่ระบุ สมมติฐานว่างถือว่าไม่มีความแตกต่างระหว่างการแจกแจงแบบสังเกตและเชิงทฤษฎีและค่าของสถิติทดสอบ 'D' คำนวณได้ดังนี้:
สูตร
$D = Maximum |F_o(X)-F_r(X)|$
ที่ไหน -
${F_o(X)}$ = การแจกแจงความถี่สะสมที่สังเกตได้ของตัวอย่างการสังเกต n แบบสุ่ม
และ ${F_o(X) = \frac{k}{n}}$ = (จำนวนข้อสังเกต≤ X) / (จำนวนการสังเกตการณ์ทั้งหมด)
${F_r(X)}$ = การแจกแจงความถี่เชิงทฤษฎี
ค่าวิกฤตของ ${D}$ พบได้จากค่าตาราง KS สำหรับการทดสอบตัวอย่างหนึ่งครั้ง
Acceptance Criteria: หากค่าที่คำนวณได้น้อยกว่าค่าวิกฤตให้ยอมรับสมมติฐานว่าง
Rejection Criteria: หากค่าที่คำนวณได้มากกว่าค่าตารางให้ปฏิเสธสมมติฐานว่าง
ตัวอย่าง
Problem Statement:
ในการศึกษาจากสตรีมต่างๆของนักศึกษา 60 คนโดยมีนักศึกษาจำนวนเท่ากันที่ดึงมาจากแต่ละสตรีมเราได้รับการสัมภาษณ์และมีการระบุความตั้งใจที่จะเข้าร่วม Drama Club ของวิทยาลัย
วท.บ. | ศ ธ | บี. คอม | MA | พม | |
---|---|---|---|---|---|
ไม่ได้ในแต่ละชั้นเรียน | 5 | 9 | 11 | 16 | 19 |
คาดว่าจะมีนักเรียน 12 คนจากแต่ละชั้นเข้าร่วม Drama Club ใช้การทดสอบ KS เพื่อค้นหาว่ามีความแตกต่างระหว่างชั้นเรียนของนักเรียนหรือไม่เกี่ยวกับความตั้งใจในการเข้าร่วม Drama Club
Solution:
${H_o}$: ไม่มีความแตกต่างระหว่างนักเรียนในสตรีมที่แตกต่างกันเกี่ยวกับความตั้งใจในการเข้าร่วมชมรมการละคร
เราพัฒนาความถี่สะสมสำหรับการแจกแจงแบบสังเกตและเชิงทฤษฎี
สตรีม | จำนวนนักเรียนที่สนใจเข้าร่วม | ${F_O(X)}$ | ${F_T(X)}$ | ${|F_O(X)-F_T(X)|}$ | |
---|---|---|---|---|---|
สังเกต (O) |
ทฤษฎี (T) |
||||
วท.บ. | 5 | 12 | 5/60 | 12/60 | 7/60 |
ศ ธ | 9 | 12 | 14/60 | 24/60 | 10 ต.ค. 60 |
B.COM. | 11 | 12 | 25/60 | 36/60 | 11/60 |
MA | 16 | 12 | 41/60 | 48/60 | 7/60 |
M.COM | 19 | 12 | 60/40 | 60/60 | 60/60 |
รวม | n = 60 | ||||
ทดสอบสถิติ ${|D|}$ คำนวณเป็น:
ค่าตารางของ D ที่ระดับนัยสำคัญ 5% กำหนดโดย
เนื่องจากค่าที่คำนวณได้มากกว่าค่าวิกฤตดังนั้นเราจึงปฏิเสธสมมติฐานว่างและสรุปได้ว่ามีความแตกต่างระหว่างนักเรียนในสตรีมที่แตกต่างกันในความตั้งใจที่จะเข้าร่วมคลับ
KS สองตัวอย่างการทดสอบ
เมื่อแทนที่จะเป็นหนึ่งจะมีตัวอย่างอิสระสองตัวอย่างจากนั้นสามารถใช้การทดสอบตัวอย่าง KS สองตัวอย่างเพื่อทดสอบข้อตกลงระหว่างการแจกแจงสะสมสองแบบ สมมติฐานว่างระบุว่าไม่มีความแตกต่างระหว่างการแจกแจงทั้งสอง D-statistic คำนวณในลักษณะเดียวกับ KS One Sample Test
สูตร
${D = Maximum |{F_n}_1(X)-{F_n}_2(X)|}$
ที่ไหน -
${n_1}$ = การสังเกตจากตัวอย่างแรก
${n_2}$ = การสังเกตจากตัวอย่างที่สอง
จะเห็นได้ว่าเมื่อการแจกแจงสะสมแสดงค่าเบี่ยงเบนสูงสุดมาก ${|D|}$ มันบ่งบอกถึงความแตกต่างระหว่างการแจกแจงตัวอย่างทั้งสอง
ค่าวิกฤตของ D สำหรับตัวอย่างที่ ${n_1 = n_2}$และคือ≤ 40 ใช้ตาราง KS สำหรับสองกรณีตัวอย่าง เมื่อไหร่${n_1}$ และ / หรือ ${n_2}$> 40 จากนั้นควรใช้ตาราง KS สำหรับตัวอย่างขนาดใหญ่ของการทดสอบสองตัวอย่าง สมมติฐานว่างเป็นที่ยอมรับหากค่าที่คำนวณได้น้อยกว่าค่าตารางและในทางกลับกัน
ดังนั้นการใช้การทดสอบแบบไม่ใช้พารามิเตอร์เหล่านี้จะช่วยให้นักวิจัยสามารถทดสอบความสำคัญของผลลัพธ์เมื่อไม่ทราบลักษณะของประชากรเป้าหมายหรือไม่มีการตั้งสมมติฐานเกี่ยวกับพวกเขา