อะไรคือความแตกต่างระหว่างความลำเอียงในการทำนายและการประมาณค่าพารามิเตอร์?
ฉันกำลังพยายามทำความเข้าใจความแตกต่างระหว่างอคติในการทำนายและการประมาณค่าพารามิเตอร์ ตัวอย่างนี้ใน Gelman, Bayesian Data Analysis , 2nd ed. 2547 หน้า 255-256 ทำให้ฉันสับสนมาก

ทำไมคุณถึงได้รับค่าประมาณ $\hat{y} = 160 + 0.25(\theta - 160)$ ได้รับการแก้ไข $\theta$ และ $\hat{\theta} = 160 + 2(y - 160)$ ภายใต้การสุ่มตัวอย่างซ้ำของ $y$ ตามเงื่อนไข $\theta$เหรอ? ฉันไม่แน่ใจว่าสมการเหล่านี้มาจากไหน
ปัญหานี้เกิดจากข้อเท็จจริงที่ว่าการแจกแจงเป็นแบบสองตัวแปร (ปกติ) มากกว่าหรือไม่ $y$ มีการกระจายตามแต่ละ $\theta$เหรอ?
คำตอบ
เปิดตามเงื่อนไข $\theta$, การกระจายของ $y$ เป็นเรื่องปกติที่มีค่าเฉลี่ย $160 + 0.5 (\theta - 160)$. สำหรับแต่ละสำนึก$y'$ จากการแจกแจงแบบมีเงื่อนไขนี้ค่าเฉลี่ยหลังของ $\theta$ คือ $$ \hat\theta(y') = 160 + 0.5 (y' - 160). $$ ดังนั้นมูลค่าที่คาดหวังของ $\hat\theta(y')$ ตามเงื่อนไข $\theta$ คือ $$ 160 + 0.5 [160 + 0.5 (\theta - 160) - 160] = 160 + 0.25 (\theta - 160). $$
มีการนำการแจกแจงแบบทวิภาคีมาใช้ในตัวอย่างเพื่อให้สามารถพูดถึง "... ภายใต้การสุ่มตัวอย่างซ้ำ ๆ ของ $y$ ตามเงื่อนไข $θ$... "กล่าวคือจากการแจกแจงแบบมีเงื่อนไขของ $y$ บน $\theta$.
ไม่ว่าในกรณีใดดูเหมือนว่าเบย์เซียนมากและแปลกไปเล็กน้อยจากมุมมองของผู้มักพูดถึง "... ภายใต้การสุ่มตัวอย่างซ้ำ ๆ ของ $y$ ตามเงื่อนไข $θ$... "โดยที่ $\theta$ คือตัวแปรที่พยายามทำนาย
(สำหรับนักวิเคราะห์บ่อยการทำนายที่เป็นกลางหมายถึงค่าเฉลี่ยของค่าที่ทำนาย $\hat{\theta}$ เท่ากับค่าเฉลี่ยของตัวแปร $\theta$ เงื่อนไขเกี่ยวกับตัวทำนาย $E[\theta|y]$.)