Thống kê - Lấy mẫu phân tầng
Chiến lược kiểm tra này được sử dụng như một phần của trường hợp dân số có thể dễ dàng được phân chia thành các nhóm hoặc các tầng lớp đặc biệt không giống nhau hoàn toàn, nhưng các thành phần bên trong một nhóm là đồng nhất về một số thuộc tính, ví dụ như trình độ học vấn của trường có thể được tách thành các tầng lớp dựa trên xu hướng tình dục, các khóa học được cung cấp, độ tuổi, v.v. Trong quần thể này ban đầu được phân chia thành các tầng và sau đó, một mẫu vật bất thường cơ bản được lấy từ mọi tầng. Kiểm tra phân tầng gồm hai loại: kiểm tra phân tầng tương xứng và kiểm tra phân tầng không cân xứng.
Proportionate Stratified Sampling- Trong trường hợp này, số lượng đơn vị được chọn từ mỗi tầng tương ứng với tỷ lệ của tầng trong dân số, ví dụ trong một trường cao đẳng có tổng số 2500 sinh viên trong đó 1500 sinh viên theo học các khóa sau đại học và 1000 sinh viên theo học các khóa sau đại học. Nếu mẫu 100 được chọn bằng cách lấy mẫu phân tầng tương ứng thì số sinh viên đại học trong mẫu sẽ là 60 và 40 sẽ là sinh viên sau đại học. Do đó, hai tầng được đại diện trong cùng một tỷ lệ trong mẫu giống như đại diện của họ trong dân số.
Phương pháp này phù hợp nhất khi mục đích của việc lấy mẫu là để ước tính giá trị tổng thể của một số đặc tính và không có sự khác biệt về phương sai nội bộ.
Disproportionate Stratified Sampling- Khi mục đích của nghiên cứu là so sánh sự khác biệt giữa các tầng lớp dân cư thì cần phải rút ra các đơn vị bình đẳng từ tất cả các tầng lớp dân cư không phân biệt tỷ trọng của họ trong dân số. Đôi khi một số địa tầng thay đổi nhiều hơn về một số đặc điểm so với các địa tầng khác, trong trường hợp đó, một số lượng đơn vị lớn hơn có thể được rút ra từ các địa tầng biến đổi hơn. Trong cả hai trường hợp, mẫu được rút ra là mẫu phân tầng không cân đối.
Sự khác biệt về kích thước địa tầng và độ biến thiên của địa tầng có thể được phân bổ tối ưu bằng cách sử dụng công thức sau để xác định cỡ mẫu từ các địa tầng khác nhau
Công thức
$ {n_i = \ frac {n.n_i \ sigma_i} {n_1 \ sigma_1 + n_2 \ sigma_2 + ... + n_k \ sigma_k} \ for \ i = 1,2 ... k} $
Ở đâu -
$ {n_i} $ = kích thước mẫu của tôi tầng lớp.
$ {n} $ = kích thước của địa tầng.
$ {\ sigma_1} $ = độ lệch chuẩn của lớp tôi.
Thêm vào đó, có thể có tình huống chi phí thu thập mẫu có thể ở một tầng cao hơn ở tầng khác. Việc lấy mẫu không cân xứng tối ưu phải được thực hiện theo cách
$ {\ frac {n_1} {n_1 \ sigma_1 \ sqrt {c_1}} = \ frac {n_2} {n_2 \ sigma_1 \ sqrt {c_2}} = ... = \ frac {n_k} {n_k \ sigma_k \ sqrt { c_k}}} $
Trong đó $ {c_1, c_2, ..., c_k} $ đề cập đến chi phí lấy mẫu trong k tầng. Cỡ mẫu từ các tầng khác nhau có thể được xác định theo công thức sau:
$ {n_i = \ frac {\ frac {n.n_i \ sigma_i} {\ sqrt {c_i}}} {\ frac {n_1 \ sigma_1} {\ sqrt {c_i}} + \ frac {n_2 \ sigma_2} {\ sqrt {c_2}} + ... + \ frac {n_k \ sigma_k} {\ sqrt {c_k}}} \ for \ i = 1,2 ... k} $
Thí dụ
Problem Statement:
Một tổ chức có 5000 nhân viên đã được phân tầng thành ba cấp.
Tầng A: 50 giám đốc điều hành với độ lệch chuẩn = 9
Tầng B: 1250 lao động phi chân tay với độ lệch chuẩn = 4
Tầng C: 3700 lao động thủ công với độ lệch chuẩn = 1
Làm thế nào để một mẫu gồm 300 nhân viên được vẽ trên cơ sở không cân xứng để có sự phân bổ tối ưu?
Solution:
Sử dụng công thức lấy mẫu không cân xứng để phân bổ tối ưu.