Qual è la distinzione tra distorsione nella previsione e stima dei parametri?

Aug 16 2020

Sto cercando di capire la distinzione tra distorsione nella previsione e stima dei parametri. Questo esempio in Gelman, Bayesian Data Analysis , 2nd ed. 2004 pp. 255-256 mi confonde molto.

  1. Perché ottieni il preventivo$\hat{y} = 160 + 0.25(\theta - 160)$dato fisso$\theta$e$\hat{\theta} = 160 + 2(y - 160)$sotto campionamento ripetuto di$y$condizionale$\theta$? Non sono sicuro da dove vengano queste equazioni.

  2. Il problema qui deriva dal fatto che la distribuzione è bivariata (normale) piuttosto che$y$avere una distribuzione basata su ciascuno$\theta$?

Risposte

1 Michael Aug 16 2020 at 06:02
  1. Condizionato$\theta$, la distribuzione di$y$è normale con media$160 + 0.5 (\theta - 160)$. Per ogni realizzazione$y'$da questa distribuzione condizionale, la media posteriore di$\theta$è$$ \hat\theta(y') = 160 + 0.5 (y' - 160). $$Quindi il valore atteso di$\hat\theta(y')$condizionale$\theta$è$$ 160 + 0.5 [160 + 0.5 (\theta - 160) - 160] = 160 + 0.25 (\theta - 160). $$

  2. La distribuzione bivariata è introdotta nell'esempio in modo che si possa parlare di "...sotto campionamento ripetuto di$y$condizionale$θ$...", cioè dalla distribuzione condizionale di$y$Su$\theta$.

In ogni caso, sembra molto bayesiano, e un po' strano dal punto di vista frequentista, parlare di "...sotto ripetuti campionamenti di$y$condizionale$θ$...", dove$\theta$è la variabile che si sta cercando di prevedere.

(Per un frequentista, la previsione imparziale indica la media del valore previsto$\hat{\theta}$è uguale alla media della variabile$\theta$condizionato dal predittore,$E[\theta|y]$.)