Qual è la distinzione tra distorsione nella previsione e stima dei parametri?
Sto cercando di capire la distinzione tra distorsione nella previsione e stima dei parametri. Questo esempio in Gelman, Bayesian Data Analysis , 2nd ed. 2004 pp. 255-256 mi confonde molto.

Perché ottieni il preventivo$\hat{y} = 160 + 0.25(\theta - 160)$dato fisso$\theta$e$\hat{\theta} = 160 + 2(y - 160)$sotto campionamento ripetuto di$y$condizionale$\theta$? Non sono sicuro da dove vengano queste equazioni.
Il problema qui deriva dal fatto che la distribuzione è bivariata (normale) piuttosto che$y$avere una distribuzione basata su ciascuno$\theta$?
Risposte
Condizionato$\theta$, la distribuzione di$y$è normale con media$160 + 0.5 (\theta - 160)$. Per ogni realizzazione$y'$da questa distribuzione condizionale, la media posteriore di$\theta$è$$ \hat\theta(y') = 160 + 0.5 (y' - 160). $$Quindi il valore atteso di$\hat\theta(y')$condizionale$\theta$è$$ 160 + 0.5 [160 + 0.5 (\theta - 160) - 160] = 160 + 0.25 (\theta - 160). $$
La distribuzione bivariata è introdotta nell'esempio in modo che si possa parlare di "...sotto campionamento ripetuto di$y$condizionale$θ$...", cioè dalla distribuzione condizionale di$y$Su$\theta$.
In ogni caso, sembra molto bayesiano, e un po' strano dal punto di vista frequentista, parlare di "...sotto ripetuti campionamenti di$y$condizionale$θ$...", dove$\theta$è la variabile che si sta cercando di prevedere.
(Per un frequentista, la previsione imparziale indica la media del valore previsto$\hat{\theta}$è uguale alla media della variabile$\theta$condizionato dal predittore,$E[\theta|y]$.)