สถิติ - การทดสอบ Kolmogorov Smirnov

การทดสอบนี้ใช้ในสถานการณ์ที่ต้องทำการเปรียบเทียบระหว่างการแจกแจงตัวอย่างที่สังเกตได้และการแจกแจงตามทฤษฎี

การทดสอบตัวอย่าง KS One

การทดสอบนี้ใช้เป็นการทดสอบความพอดีและเหมาะอย่างยิ่งเมื่อขนาดของตัวอย่างมีขนาดเล็ก จะเปรียบเทียบฟังก์ชันการแจกแจงสะสมสำหรับตัวแปรที่มีการแจกแจงที่ระบุ สมมติฐานว่างถือว่าไม่มีความแตกต่างระหว่างการแจกแจงแบบสังเกตและเชิงทฤษฎีและค่าของสถิติทดสอบ 'D' คำนวณได้ดังนี้:

สูตร

$D = Maximum |F_o(X)-F_r(X)|$

ที่ไหน -

${F_o(X)}$ = การแจกแจงความถี่สะสมที่สังเกตได้ของตัวอย่างการสังเกต n แบบสุ่ม
และ ${F_o(X) = \frac{k}{n}}$ = (จำนวนข้อสังเกต≤ X) / (จำนวนการสังเกตการณ์ทั้งหมด)
${F_r(X)}$ = การแจกแจงความถี่เชิงทฤษฎี

ค่าวิกฤตของ ${D}$ พบได้จากค่าตาราง KS สำหรับการทดสอบตัวอย่างหนึ่งครั้ง

Acceptance Criteria: หากค่าที่คำนวณได้น้อยกว่าค่าวิกฤตให้ยอมรับสมมติฐานว่าง

Rejection Criteria: หากค่าที่คำนวณได้มากกว่าค่าตารางให้ปฏิเสธสมมติฐานว่าง

ตัวอย่าง

Problem Statement:

ในการศึกษาจากสตรีมต่างๆของนักศึกษา 60 คนโดยมีนักศึกษาจำนวนเท่ากันที่ดึงมาจากแต่ละสตรีมเราได้รับการสัมภาษณ์และมีการระบุความตั้งใจที่จะเข้าร่วม Drama Club ของวิทยาลัย

	วท.บ.	ศ ธ	บี. คอม	MA	พม
ไม่ได้ในแต่ละชั้นเรียน	5	9	11	16	19

คาดว่าจะมีนักเรียน 12 คนจากแต่ละชั้นเข้าร่วม Drama Club ใช้การทดสอบ KS เพื่อค้นหาว่ามีความแตกต่างระหว่างชั้นเรียนของนักเรียนหรือไม่เกี่ยวกับความตั้งใจในการเข้าร่วม Drama Club

Solution:

${H_o}$: ไม่มีความแตกต่างระหว่างนักเรียนในสตรีมที่แตกต่างกันเกี่ยวกับความตั้งใจในการเข้าร่วมชมรมการละคร

เราพัฒนาความถี่สะสมสำหรับการแจกแจงแบบสังเกตและเชิงทฤษฎี

สตรีม	จำนวนนักเรียนที่สนใจเข้าร่วม		${F_O(X)}$	${F_T(X)}$	${\|F_O(X)-F_T(X)\|}$
	สังเกต (O)	ทฤษฎี (T)
วท.บ.	5	12	5/60	12/60	7/60
ศ ธ	9	12	14/60	24/60	10 ต.ค. 60
B.COM.	11	12	25/60	36/60	11/60
MA	16	12	41/60	48/60	7/60
M.COM	19	12	60/40	60/60	60/60
รวม	n = 60

ทดสอบสถิติ ${|D|}$ คำนวณเป็น:

$D = Maximum {|F_0 (X)-F_T (X)|} \\[7pt] \, = \frac{11}{60} \\[7pt] \, = 0.183$

ค่าตารางของ D ที่ระดับนัยสำคัญ 5% กำหนดโดย

${D_0.05 = \frac{1.36}{\sqrt{n}}} \\[7pt] \, = \frac{1.36}{\sqrt{60}} \\[7pt] \, = 0.175$

เนื่องจากค่าที่คำนวณได้มากกว่าค่าวิกฤตดังนั้นเราจึงปฏิเสธสมมติฐานว่างและสรุปได้ว่ามีความแตกต่างระหว่างนักเรียนในสตรีมที่แตกต่างกันในความตั้งใจที่จะเข้าร่วมคลับ

KS สองตัวอย่างการทดสอบ

เมื่อแทนที่จะเป็นหนึ่งจะมีตัวอย่างอิสระสองตัวอย่างจากนั้นสามารถใช้การทดสอบตัวอย่าง KS สองตัวอย่างเพื่อทดสอบข้อตกลงระหว่างการแจกแจงสะสมสองแบบ สมมติฐานว่างระบุว่าไม่มีความแตกต่างระหว่างการแจกแจงทั้งสอง D-statistic คำนวณในลักษณะเดียวกับ KS One Sample Test

สูตร

${D = Maximum |{F_n}_1(X)-{F_n}_2(X)|}$

ที่ไหน -

${n_1}$ = การสังเกตจากตัวอย่างแรก
${n_2}$ = การสังเกตจากตัวอย่างที่สอง

จะเห็นได้ว่าเมื่อการแจกแจงสะสมแสดงค่าเบี่ยงเบนสูงสุดมาก ${|D|}$ มันบ่งบอกถึงความแตกต่างระหว่างการแจกแจงตัวอย่างทั้งสอง

ค่าวิกฤตของ D สำหรับตัวอย่างที่ ${n_1 = n_2}$และคือ≤ 40 ใช้ตาราง KS สำหรับสองกรณีตัวอย่าง เมื่อไหร่${n_1}$ และ / หรือ ${n_2}$> 40 จากนั้นควรใช้ตาราง KS สำหรับตัวอย่างขนาดใหญ่ของการทดสอบสองตัวอย่าง สมมติฐานว่างเป็นที่ยอมรับหากค่าที่คำนวณได้น้อยกว่าค่าตารางและในทางกลับกัน

ดังนั้นการใช้การทดสอบแบบไม่ใช้พารามิเตอร์เหล่านี้จะช่วยให้นักวิจัยสามารถทดสอบความสำคัญของผลลัพธ์เมื่อไม่ทราบลักษณะของประชากรเป้าหมายหรือไม่มีการตั้งสมมติฐานเกี่ยวกับพวกเขา