สถิติ - การสุ่มตัวอย่างแบบแบ่งชั้น

กลยุทธ์ในการตรวจสอบนี้ใช้เป็นส่วนหนึ่งของสถานการณ์ที่ประชากรสามารถแบ่งออกได้อย่างง่ายดายในการชุมนุมหรือชั้นที่ไม่เหมือนกันโดยเฉพาะอย่างยิ่ง แต่องค์ประกอบในการชุมนุมมีความเป็นเนื้อเดียวกันเกี่ยวกับคุณลักษณะบางประการเช่นการศึกษาในโรงเรียน สามารถแบ่งออกเป็นชั้น ๆ บนพื้นฐานของรสนิยมทางเพศหลักสูตรที่เปิดสอนอายุและอื่น ๆ ในสิ่งนี้ประชากรจะถูกแบ่งออกเป็นชั้นแรกและหลังจากนั้นตัวอย่างที่ผิดปกติพื้นฐานจะถูกนำมาจากทุกชั้น การทดสอบแบบแบ่งชั้นแบ่งออกเป็นสองประเภท ได้แก่ การตรวจสอบแบบแบ่งชั้นตามสัดส่วนและการตรวจสอบแบบแบ่งชั้นที่ไม่ได้สัดส่วน

  • Proportionate Stratified Sampling- ในจำนวนหน่วยที่เลือกจากแต่ละชั้นจะเป็นสัดส่วนกับส่วนแบ่งของชั้นในประชากรเช่นในวิทยาลัยมีนักเรียนทั้งหมด 2500 คนจากจำนวนนักเรียน 1,500 คนที่ลงทะเบียนเรียนในหลักสูตรระดับบัณฑิตศึกษาและ 1,000 คนลงทะเบียนในหลักสูตรระดับบัณฑิตศึกษา หากต้องเลือกตัวอย่าง 100 ตัวอย่างโดยใช้การสุ่มตัวอย่างแบบแบ่งชั้นตามสัดส่วนจำนวนนักศึกษาระดับปริญญาตรีในกลุ่มตัวอย่างจะเป็น 60 และ 40 คนจะเป็นนักศึกษาระดับบัณฑิตศึกษา ดังนั้นทั้งสองชั้นจึงแสดงในสัดส่วนเดียวกันในกลุ่มตัวอย่างเช่นเดียวกับการแสดงในประชากร

    วิธีนี้เหมาะสมที่สุดเมื่อวัตถุประสงค์ของการสุ่มตัวอย่างคือการประมาณค่าประชากรของลักษณะบางอย่างและไม่มีความแตกต่างในความแปรปรวนภายในชั้น

  • Disproportionate Stratified Sampling- เมื่อจุดประสงค์ของการศึกษาคือการเปรียบเทียบความแตกต่างระหว่างชั้นจึงจำเป็นต้องดึงหน่วยที่เท่ากันจากทุกชั้นโดยไม่คำนึงถึงส่วนแบ่งในประชากร บางครั้งชั้นบางชั้นมีความผันแปรเมื่อเทียบกับลักษณะบางอย่างมากกว่าชั้นอื่น ๆ ในกรณีเช่นนี้อาจมีการดึงหน่วยจำนวนมากจากชั้นที่มีตัวแปรมากกว่า ในทั้งสองสถานการณ์ตัวอย่างที่วาดเป็นตัวอย่างที่แบ่งชั้นไม่ได้สัดส่วน

    ความแตกต่างของขนาดชั้นและความแปรปรวนของชั้นสามารถจัดสรรได้อย่างเหมาะสมที่สุดโดยใช้สูตรต่อไปนี้เพื่อกำหนดขนาดตัวอย่างจากชั้นต่างๆ

    สูตร

    $ {n_i = \ frac {n.n_i \ sigma_i} {n_1 \ sigma_1 + n_2 \ sigma_2 + ... + n_k \ sigma_k} \ สำหรับ \ i = 1,2 ... k} $

    ที่ไหน -

    • $ {n_i} $ = ขนาดตัวอย่างของ i strata

    • $ {n} $ = ขนาดของชั้น

    • $ {\ sigma_1} $ = ค่าเบี่ยงเบนมาตรฐานของ i strata

    นอกจากนี้อาจมีสถานการณ์ที่ค่าใช้จ่ายในการรวบรวมตัวอย่างอาจสูงกว่าในชั้นอื่น ๆ การสุ่มตัวอย่างที่ไม่ได้สัดส่วนที่เหมาะสมควรทำในลักษณะที่

    $ {\ frac {n_1} {n_1 \ sigma_1 \ sqrt {c_1}} = \ frac {n_2} {n_2 \ sigma_1 \ sqrt {c_2}} = ... = \ frac {n_k} {n_k \ sigma_k \ sqrt { c_k}}} $

    โดยที่ $ {c_1, c_2, ... , c_k} $ หมายถึงต้นทุนของการสุ่มตัวอย่างใน k ชั้น ขนาดของตัวอย่างจากชั้นต่างๆสามารถกำหนดได้โดยใช้สูตรต่อไปนี้:

    $ {n_i = \ frac {\ frac {n.n_i \ sigma_i} {\ sqrt {c_i}}} {\ frac {n_1 \ sigma_1} {\ sqrt {c_i}} + \ frac {n_2 \ sigma_2} {\ sqrt {c_2}} + ... + \ frac {n_k \ sigma_k} {\ sqrt {c_k}}} \ สำหรับ \ i = 1,2 ... k} $

ตัวอย่าง

Problem Statement:

องค์กรมีพนักงาน 5,000 คนที่แบ่งชั้นออกเป็นสามระดับ

  • Stratum A: ผู้บริหาร 50 คนที่มีค่าเบี่ยงเบนมาตรฐาน = 9

  • Stratum B: 1250 คนงานที่ไม่ต้องใช้คนงานที่มีค่าเบี่ยงเบนมาตรฐาน = 4

  • Stratum C: ผู้ปฏิบัติงานด้วยตนเอง 3700 คนที่มีค่าเบี่ยงเบนมาตรฐาน = 1

ตัวอย่างพนักงาน 300 คนจะถูกดึงออกมาโดยไม่ได้สัดส่วนอย่างไรโดยมีการจัดสรรที่เหมาะสมที่สุด?

Solution:

ใช้สูตรของการสุ่มตัวอย่างที่ไม่ได้สัดส่วนเพื่อการจัดสรรที่เหมาะสม

$ {n_i = \ frac {n.n_i \ sigma_i} {n_1 \ sigma_1 + n_2 \ sigma_2 + n_3 \ sigma_3}} \\ [7pt] \, สำหรับสตรีม A, {n_1 = \ frac {300 (50) (9 )} {(50) (9) + (1250) (4) + (3700) (1)}} \\ [7pt] \, = {\ frac {135000} {1950} = {14.75} \ หรือ \ พูด \ {15}} \\ [7pt] \, สำหรับสตรีม B, {n_1 = \ frac {300 (1250) (4)} {(50) (9) + (1250) (4) + (3700) (1 )}} \\ [7pt] \, = {\ frac {150000} {1950} = {163.93} \ หรือ \ say \ {167}} \\ [7pt] \, สำหรับสตรีม C, {n_1 = \ frac { 300 (3700) (1)} {(50) (9) + (1250) (4) + (3700) (1)}} \\ [7pt] \, = {\ frac {110000} {1950} = { 121.3} \ หรือ \ พูด \ {121}} $