予測とパラメータ推定のバイアスの違いは何ですか?
予測のバイアスとパラメータ推定の違いを理解しようとしています。Gelman、Bayesian Data Analysis、第2版のこの例。2004pp。255-256は、私には非常に混乱しています。
なぜ見積もりを得るのですか $\hat{y} = 160 + 0.25(\theta - 160)$ 与えられた固定 $\theta$ そして $\hat{\theta} = 160 + 2(y - 160)$ の繰り返しサンプリングの下で $y$ 条件付き $\theta$?これらの方程式がどこから来ているのかわかりません。
ここでの問題は、分布が2変量(正規)ではなく2変量(正規)であるという事実に起因しますか? $y$ それぞれに基づいて分布を持っている $\theta$?
回答
条件付き $\theta$、の分布 $y$ 平均で正常です $160 + 0.5 (\theta - 160)$。実現ごとに$y'$ この条件付き分布から、の事後平均 $\theta$ です $$ \hat\theta(y') = 160 + 0.5 (y' - 160). $$ したがって、の期待値 $\hat\theta(y')$ 条件付き $\theta$ です $$ 160 + 0.5 [160 + 0.5 (\theta - 160) - 160] = 160 + 0.25 (\theta - 160). $$
二変量分布が例に導入されているので、「...の繰り返しサンプリングの下で」について話すことができます。 $y$ 条件付き $θ$...」、つまりの条件付き分布から $y$ オン $\theta$。
いずれにせよ、「...の繰り返しのサンプリングの下で」と話すことは非常にベイジアンであり、頻度主義の観点からは少し奇妙に思えます $y$ 条件付き $θ$..."、 どこ $\theta$ 予測しようとしている変数です。
(頻度主義者にとって、偏りのない予測とは、予測値の平均を意味します $\hat{\theta}$ 変数の平均に等しい $\theta$ 予測子を条件として、 $E[\theta|y]$。)