Sự khác biệt về tỷ lệ giữa hai mẫu: Tại sao ước tính sai số chuẩn không phải là vấn đề đối với tính chuẩn?
Đầu tiên, đây có vẻ như là một câu hỏi rất phổ biến, nhưng tôi hứa rằng tôi đã tìm kiếm trong một thời gian dài qua các bài đăng tương tự khác và vẫn chưa tìm được giải pháp nào có thể cung cấp câu trả lời. ( Điều này và điều này đến rất gần, nhưng tôi không nghĩ rằng cũng không trả lời được nó!).
Tôi sẽ giải thích rất cặn kẽ về sự nhầm lẫn của mình, bằng cách so sánh nó trước với trường hợp tỷ lệ một mẫu. Chúng tôi có thể kiểm tra xem tỷ lệ thực sự$p$ bằng một số giá trị $c$.
$H_0: p = c.$
$H_A: p \neq c.$
Đối với $np$ và $n(1-p)$ đủ lớn, xấp xỉ nhị thức với bình thường cho chúng ta $\hat{p} \sim N(p, p(1-p)/n)$. Do đó, khi chúng tôi tính toán thống kê thử nghiệm,$Z := \frac{\hat{p} - c}{\sqrt{c(1-c)/n}}.$Theo giả thuyết rỗng, điều này được phân phối như là chuẩn bình thường. Điều quan trọng, chúng tôi không ước tính sai số tiêu chuẩn - nó được xác định bởi giả thuyết vô hiệu!
Thay vào đó, chúng tôi xem xét trường hợp hai mẫu, trong đó chúng tôi muốn chạy một bài kiểm tra giả thuyết về sự khác biệt về tỷ lệ.
$H_0: p_1 - p_2 = 0.$
$H_A: p_1 - p_2 \neq 0.$
Xấp xỉ nhị thức giống nhau cho chúng ta $\hat{p}_i \sim N(p_i, p_i(1-p_i)/n_i)$, $i=1,2$. Sau đó nếu$\tilde{p}$ là tỷ lệ gộp ($\hat{p} = (x_1 + x_2)/(n_1+n_2)$), Tôi biết rằng thống kê thử nghiệm của chúng tôi được đưa ra bởi $Z := \frac{\hat{p}_1 - \hat{p}_2}{\sqrt{\tilde{p}(1-\tilde{p})(1/n_1 + 1/n_2)}}.$
Đây là phần cốt yếu tôi không tuân theo. Trong trường hợp một mẫu, chúng tôi không ước tính được sai số chuẩn - nó được xác định bởi giá trị rỗng. Do đó, trích dẫn thông thường tiêu chuẩn có ý nghĩa. Trong trường hợp hai mẫu, chúng ta phải ước lượng sai số chuẩn, sử dụng tỷ lệ gộp của chúng tôi! Vì vậy, về cơ bản, chúng ta không phải thực hiện một số loại điều chỉnh để phản ánh điều này? (Tức là, giống như những gì chúng ta làm với bài kiểm tra t).
Vì vậy, làm thế nào tôi có thể giải thích điều này? Tại sao chúng ta vẫn có thể trích dẫn mức bình thường chuẩn, mặc dù chúng ta đang sử dụng ước tính dựa trên dữ liệu cho sai số chuẩn của nó?
Mặc dù câu hỏi tương tự như câu hỏi của bài kiểm tra t, nhưng tôi hiểu tại sao chúng ta không thể chỉ sử dụng bài kiểm tra t (chúng tôi không đáp ứng các giả định khác). Nỗ lực tốt nhất của tôi cho một câu trả lời cho đến nay chỉ đơn giản là:
“Đúng vậy, chúng tôi đang ước tính sai số tiêu chuẩn, nhưng ước lượng gần đúng đó bị nuốt chửng bởi ước lượng gần đúng chuẩn ban đầu của chúng tôi đối với nhị thức, bởi vì dù sao điều đó cũng chỉ hoạt động ở bậc tự do cao”?
Có một lời giải thích tốt hơn rằng? Cảm giác trực quan rằng một số điều chỉnh sẽ là cần thiết, nhưng chúng tôi không thực hiện.
Để có lời giải thích ngắn gọn về lý do tại sao hai liên kết mà tôi đã trích dẫn có vẻ như chúng không hoàn toàn đề cập đến vấn đề này ...
Câu trả lời của @glen_b rất hay và giải thích rõ ràng lý do tại sao các giả định lý thuyết cần thiết cho một bài kiểm tra t sẽ không phù hợp ở đây. Tuy nhiên, tôi không thấy nó giải thích vấn đề chính xác này. Nó đề cập đến cả một và hai bài kiểm tra tỷ lệ mẫu, và sự bối rối của tôi là chúng không giống nhau ở mặt này. Nhưng điều này giúp thông báo cho phỏng đoán tốt nhất của tôi ở trên, đó là đối với các kích thước mẫu đủ lớn để ước lượng chuẩn của chúng tôi, ước tính sai số chuẩn về cơ bản là không liên quan.
Tương tự, @ whuber's cho thấy rất rõ ràng (với các biểu đồ) cách phân phối student-t không xấp xỉ thống kê thử nghiệm của chúng tôi tốt hơn bất kỳ (đối với kích thước mẫu vừa phải) so với tiêu chuẩn đơn giản thông thường.
Vì vậy, tôi hiểu tại sao phân phối student-t không phải là lựa chọn tốt hơn ở đây. Nhưng sự bối rối kéo dài của tôi chỉ đơn giản là: ngay cả khi học sinh-t không phải là cách sửa chữa phù hợp, thì cách tốt nhất để mô tả tại sao chúng tôi không cung cấp bất kỳ loại điều chỉnh nào ở đây? Tôi thấy trường hợp một mẫu và hai trường hợp mẫu được mô tả tương đương - "điều đó là bình thường vì phương sai được xác định bởi giá trị trung bình". Nhưng các trường hợp có vẻ khá khác nhau - trong một trường hợp, chúng tôi ước tính sai số tiêu chuẩn, còn trường hợp khác thì không. Có phải câu trả lời chỉ đơn giản là "một khi chúng ta đã tính gần đúng chênh lệch tỷ lệ nhị thức với một chuẩn tắc, thì ước tính sai số chuẩn là nhỏ so với ước lượng gần đúng đó, vì vậy chúng ta có thể bỏ qua nó"?
Trả lời
Như trong câu trả lời bạn liên kết, bạn lại sử dụng định lý Slutsky , cụ thể là dạng thứ ba (tỷ lệ) tại liên kết Wikipedia.
Nếu bạn viết $Z_n$ như $X_n/Y_n$ Ở đâu
$$X_n = \frac{\hat{p}_1 - \hat{p}_2}{\sqrt{p_0(1-p_0)(1/n_1 + 1/n_2)}}$$
$$Y_n = \frac{\sqrt{\tilde{p}(1-\tilde{p})}}{\sqrt{p_0(1-p_0)}}$$
Ở đâu $p_0$ là tỷ lệ dân số chung dưới giá trị rỗng và $n_1$ và $n_2$ tăng theo tỷ lệ * (hoặc, cách khác bằng cách cho phép $n$ nhỏ hơn $n_1$ và $n_2$ thay vào đó) thì định lý sẽ được áp dụng, và $Y_n$ hội tụ với $1$, như vậy $n\to\infty$ trình tự $Z_n$ hội tụ đến cùng một phân phối $X_n$ hiện (tức là với phân phối chuẩn chuẩn).
* phần này có thể được chính thức hóa, theo một số cách tương tự có thể, liên quan đến một chuỗi $n_1$ và $n_2$ giá trị để $n$ trong khi giữ chúng theo tỷ lệ