Sự khác biệt giữa độ chệch trong dự đoán và ước lượng tham số là gì?
Tôi đang cố gắng hiểu sự khác biệt giữa sự thiên vị trong dự đoán và ước tính tham số. Ví dụ này trong Gelman, Phân tích dữ liệu Bayes , xuất bản lần thứ 2. 2004 trang 255-256 rất khó hiểu đối với tôi.
Tại sao bạn nhận được ước tính $\hat{y} = 160 + 0.25(\theta - 160)$ đã cố định $\theta$ và $\hat{\theta} = 160 + 2(y - 160)$ dưới sự lấy mẫu lặp lại của $y$ có điều kiện $\theta$? Tôi không chắc những phương trình này đến từ đâu.
Có phải vấn đề ở đây xuất phát từ thực tế là phân phối là lưỡng biến (bình thường) chứ không phải $y$ có một phân phối dựa trên mỗi $\theta$?
Trả lời
Có điều kiện về $\theta$, sự phân phối của $y$ là bình thường với trung bình $160 + 0.5 (\theta - 160)$. Đối với mỗi nhận thức$y'$ từ phân phối có điều kiện này, giá trị trung bình sau của $\theta$ Là $$ \hat\theta(y') = 160 + 0.5 (y' - 160). $$ Vì vậy, giá trị kỳ vọng của $\hat\theta(y')$ có điều kiện $\theta$ Là $$ 160 + 0.5 [160 + 0.5 (\theta - 160) - 160] = 160 + 0.25 (\theta - 160). $$
Phân phối lưỡng biến được đưa vào ví dụ để người ta có thể nói về "... trong quá trình lấy mẫu lặp lại $y$ có điều kiện $θ$... ", tức là từ phân phối có điều kiện của $y$ trên $\theta$.
Trong mọi trường hợp, có vẻ rất Bayes, và hơi kỳ lạ từ quan điểm của người theo chủ nghĩa thường xuyên, khi nói về "... dưới sự lấy mẫu lặp đi lặp lại của $y$ có điều kiện $θ$...", Ở đâu $\theta$ là biến mà người ta đang cố gắng dự đoán.
(Đối với một người thường xuyên, dự đoán không thiên vị có nghĩa là giá trị trung bình của giá trị dự đoán $\hat{\theta}$ bằng giá trị trung bình của biến $\theta$ có điều kiện về dự đoán, $E[\theta|y]$.)