В чем разница между систематической ошибкой в прогнозировании и оценкой параметров?
Я пытаюсь понять разницу между систематической ошибкой в прогнозировании и оценкой параметров. Этот пример в Гельмане, Байесовский анализ данных , 2-е изд. 2004 pp. 255-256 меня очень сбивает с толку.
Почему вы получаете оценку $\hat{y} = 160 + 0.25(\theta - 160)$ учитывая фиксированный $\theta$ и $\hat{\theta} = 160 + 2(y - 160)$ при повторной выборке $y$ при условии $\theta$? Я не уверен, откуда берутся эти уравнения.
Проблема здесь в том, что распределение является двумерным (нормальным), а не $y$ имея распределение на основе каждого $\theta$?
Ответы
При условии $\theta$, распределение $y$ нормально со средним $160 + 0.5 (\theta - 160)$. Для каждой реализации$y'$ из этого условного распределения, апостериорное среднее $\theta$ является $$ \hat\theta(y') = 160 + 0.5 (y' - 160). $$ Итак, ожидаемое значение $\hat\theta(y')$ при условии $\theta$ является $$ 160 + 0.5 [160 + 0.5 (\theta - 160) - 160] = 160 + 0.25 (\theta - 160). $$
Двумерное распределение вводится в пример, чтобы можно было говорить о "... при повторной выборке $y$ при условии $θ$... », т.е. из условного распределения $y$ на $\theta$.
В любом случае, кажется очень байесовским и немного странным с частотной точки зрения говорить о «... при повторной выборке $y$ при условии $θ$...", где $\theta$ переменная, которую пытаются предсказать.
(Для частотного специалиста непредвзятый прогноз означает среднее значение предсказанного значения $\hat{\theta}$ равно среднему значению переменной $\theta$ зависит от предиктора, $E[\theta|y]$.)