Thống kê - Kích thước mẫu bắt buộc

Một phần quan trọng của thử nghiệm là việc lựa chọn biện pháp thử nghiệm, tức là số lượng đơn vị được chọn từ dân chúng để hoàn thành việc thăm dò. Không có câu trả lời hoặc câu trả lời rõ ràng nào cho việc xác định đặc điểm của kích thước phù hợp nhất. Chắc chắn có những phán đoán sai lầm đối với khoảng thời gian thử nghiệm như ví dụ phải là 10% dân số hoặc kích thước mẫu vật tương đối với phạm vi vũ trụ. Tuy nhiên như đã nói trước đây, đây chỉ là những nhận định sai lầm. Mức độ rộng rãi của một mẫu vật là khả năng của giống trong các thông số phổ biến đang được nghiên cứu và độ chính xác đánh giá theo yêu cầu của chuyên gia.

Quyết định về kích thước tối ưu của mẫu có thể được tiếp cận từ hai góc độ. chủ quan và toán học.

  1. Phương pháp tiếp cận chủ quan để xác định cỡ mẫu

  2. Phương pháp toán học để xác định kích thước mẫu

Phương pháp tiếp cận chủ quan để xác định cỡ mẫu

Việc lựa chọn cỡ mẫu bị ảnh hưởng bởi các yếu tố khác nhau được thảo luận như sau:

  • The Nature of Population- Mức độ đồng nhất hoặc không đồng nhất ảnh hưởng đến mức độ của mẫu vật. Nếu quần chúng đồng nhất về các phẩm chất quan tâm thì ngay cả một kích thước nhỏ của mẫu vật cũng đủ. Tuy nhiên, trong trường hợp quần chúng không đồng nhất thì cần phải có một ví dụ lớn hơn để đảm bảo đủ tính đại diện.

  • Nature of Respondent- Nếu người trả lời có thể truy cập dễ dàng và có sẵn thì dữ liệu yêu cầu có thể được lấy từ một ví dụ nhỏ. Mặc dù vậy, nếu những người được hỏi tỏ ra bất hợp tác và không phản ứng được dựa vào mức cao thì cần phải có một mẫu vật lớn hơn.

  • Nature of Study- Một nghiên cứu một lần có thể được dẫn dắt bằng cách sử dụng một ví dụ quan trọng. Nếu có sự xuất hiện của các nghiên cứu kiểm tra có tính chất liên tục và cần được hoàn thành một cách nghiêm túc, thì một mẫu vật nhỏ sẽ phù hợp hơn vì nó là bất cứ thứ gì nhưng khó giám sát và lưu giữ một ví dụ nhỏ trong một thời gian dài.

  • Sampling Technique Used- Một biến quan trọng ảnh hưởng đến khoảng thời gian của bài kiểm tra là hệ thống kiểm tra nhận được. Thứ nhất, một hệ thống không có khả năng xảy ra yêu cầu một mẫu vật lớn hơn một chiến lược khả năng. Bên cạnh việc kiểm tra khả năng xảy ra bên trong, nếu việc kiểm tra bất thường đơn giản được sử dụng, nó đòi hỏi một ví dụ lớn hơn so với việc sử dụng phân tầng, trong đó một ít mẫu vật là đủ.

  • Complexity of Tabulation- Trong khi giải quyết ước tính mẫu vật, chuyên gia cũng nên xem xét số lượng các phân loại và phân loại mà các khám phá sẽ được tập hợp và chia nhỏ. Người ta đã thấy rằng số lượng phân loại được tạo ra càng lớn thì kích thước ví dụ càng lớn. Vì mọi phân loại phải được nói đến đủ, nên cần phải có một mẫu vật lớn hơn để đưa ra các phép đo chắc chắn về phân loại nhỏ nhất.

  • Availability of Resources- Nội dung và thời gian mà chuyên gia có thể tiếp cận ảnh hưởng đến khoảng thời gian thử nghiệm. Kiểm tra là một giai đoạn và tiền mặt được phân công leo thang, với các bài tập như sự sẵn sàng của công cụ, hợp đồng và chuẩn bị cho nhân viên hiện trường, chi phí vận chuyển, v.v. chiếm một lượng lớn tài sản. Sau đó, nếu nhà khoa học không có đủ thời gian và sự hỗ trợ có thể tiếp cận, anh ta sẽ giải quyết trên một ví dụ nhỏ hơn.

  • Degree of Precision and Accuracy Required- Từ bài phát biểu trước đây của chúng tôi, điều đã làm rõ ràng rằng độ chính xác, được đo bằng sai lầm tiêu chuẩn, sẽ cao chỉ khi SE nhỏ hơn hoặc kích thước ví dụ là đáng kể.

Ngoài ra, để có được độ chính xác cao, cần phải có mẫu lớn hơn. Ngoài ra, những nỗ lực chủ quan này, cỡ mẫu cũng có thể được xác định bằng toán học.

Phương pháp toán học để xác định kích thước mẫu

Trong cách tiếp cận toán học để xác định cỡ mẫu, độ chính xác của ước tính cần thiết được nêu trước và sau đó mới tính cỡ mẫu. Độ chính xác có thể được chỉ định là $ {\ pm} $ 1 của giá trị trung bình thực với mức độ tin cậy 99%. Điều này có nghĩa là nếu giá trị trung bình của mẫu là 200, thì giá trị thực của giá trị trung bình sẽ nằm trong khoảng từ 199 đến 201. Mức độ chính xác này được biểu thị bằng thuật ngữ 'c'

Xác định Cỡ mẫu cho các phương tiện.

Khoảng tin cậy cho trung bình vũ trụ được đưa ra bởi

$ {\ bar x \ pm Z \ frac {\ sigma_p} {\ sqrt N} \ hoặc \ bar x \ pm e} $

Ở đâu -

  • $ {\ bar x} $ = Trung bình mẫu

  • $ {e} $ = Lỗi có thể chấp nhận được

  • $ {Z} $ = Giá trị của biến thể chuẩn thông thường ở một mức độ tin cậy nhất định

  • $ {\ sigma_p} $ = Độ lệch chuẩn của tổng thể

  • $ {n} $ = Kích thước của mẫu

Lỗi có thể chấp nhận được 'e' tức là sự khác biệt giữa $ {\ mu} $ và $ {\ bar x} $ được đưa ra bởi

$ {Z. \ frac {\ sigma_p} {\ sqrt N}} $

Như vậy, Kích thước của mẫu là:

$ {n = \ frac {Z ^ 2 {\ sigma_p} ^ 2} {e ^ 2}} $

Hoặc là

Trong trường hợp kích thước mẫu là đáng kể so với quy mô dân số thì công thức trên sẽ được hiệu chỉnh bằng hệ số nhân dân số hữu hạn.

$ {n = \ frac {Z ^ 2.N. {\ sigma_p} ^ 2} {(N-1) e ^ 2 + Z ^ 2. {\ sigma_p} ^ 2}} $

Ở đâu -

  • $ {N} $ = quy mô dân số

Xác định cỡ mẫu cho các tỷ lệ

Phương pháp xác định cỡ mẫu khi ước tính tỷ trọng vẫn giống như phương pháp ước tính giá trị trung bình. Khoảng tin cậy cho tỷ lệ vũ trụ $ {\ hat p} $ được đưa ra bởi

$ {p \ pm Z. \ sqrt {\ frac {pq} {n}}} $

Ở đâu -

  • $ {p} $ = tỷ lệ mẫu

  • $ {q = (1 - p)} $

  • $ {Z} $ = Giá trị của biến thể chuẩn thông thường cho tỷ lệ mẫu

  • $ {n} $ = Kích thước của mẫu

Vì $ {\ hat p} $ được ước tính nên giá trị của p có thể được xác định bằng cách lấy giá trị p = 0,5, một giá trị có thể chấp nhận được, đưa ra cỡ mẫu vừa phải. Lựa chọn khác là giá trị của p được ước tính thông qua một nghiên cứu thí điểm hoặc dựa trên đánh giá cá nhân. Với giá trị của p, sai số chấp nhận được 'e' là

$ {e = Z. \ sqrt {\ frac {pq} {n}} \\ [7pt] e ^ 2 = Z ^ 2 \ frac {pq} {n} \\ [7pt] n = \ frac {Z ^ 2.pq} {e ^ 2}} $

Trong trường hợp dân số là hữu hạn thì công thức trên sẽ được hiệu chỉnh bằng cấp số nhân của quần thể hữu hạn.

$ {n = \ frac {Z ^ 2.pqN} {e ^ 2 (N-1) + Z ^ 2.pq}} $

Thí dụ

Problem Statement:

Một cửa hàng mua sắm quan tâm đến việc ước tính tỷ lệ hộ gia đình sở hữu thẻ Thành viên Đặc quyền của cửa hàng. Các nghiên cứu trước đây đã chỉ ra rằng 59% hộ gia đình có thẻ tín dụng cửa hàng. Ở mức tin cậy 95% với mức sai số có thể chấp nhận được là 05.

  1. Xác định cỡ mẫu cần thiết để tiến hành nghiên cứu.

  2. Cỡ mẫu sẽ là bao nhiêu nếu biết số lượng hộ gia đình mục tiêu là 1000?

Solution:

Cửa hàng có thông tin sau

$ {p = .59 \\ [7pt] \ Rightarrow q = (1-p) = (1-.59) = .41 \\ [7pt] CL = .95 \\ [7pt] Và \ the \ Z \ standard \ variate \ for \ CL \ .95 \ is \ 1.96 \\ [7pt] e = \ pm .05} $

Cỡ mẫu có thể được xác định bằng cách áp dụng công thức sau:

$ {n = \ frac {Z ^ 2.pq} {e ^ 2}} $
$ {n = \ frac {(1.96) ^ 2. (. 59). (. 41)} {(. 05) ^ 2} \\ [7pt] = \ frac {.9226} {. 0025} \\ [ 7pt] = 369} $

Do đó, một mẫu gồm 369 hộ gia đình là đủ để thực hiện nghiên cứu.

Vì dân số, tức là các hộ gia đình mục tiêu được biết đến là 1000 và mẫu trên là một tỷ lệ đáng kể trong tổng dân số nên công thức hiệu chỉnh bao gồm số nhân dân số hữu hạn được sử dụng.

$ {n = \ frac {Z ^ 2.pqN} {e ^ 2 (N-1) + Z ^ 2.pq} \\ [7pt] = \ frac {(1.96) ^ 2. (. 59). ( .41). (1000)} {(. 05) ^ 2 \ times 999 + (1.96) ^ 2 (.59) (. 41)} \\ [7pt] = \ frac {922.6} {2.497 + .922} \\ [7pt] = 270} $

Do đó, nếu dân số là một nhóm hữu hạn với 1000 hộ gia đình thì cỡ mẫu cần thiết để thực hiện nghiên cứu là 270.

Từ minh họa này có thể thấy rõ rằng nếu quy mô dân số được biết thì kích thước mẫu được xác định đã giảm kích thước.