Quelle est la différence entre le biais de prédiction et l'estimation des paramètres ?

Aug 16 2020

J'essaie de comprendre la distinction entre le biais dans la prédiction et l'estimation des paramètres. Cet exemple dans Gelman, Bayesian Data Analysis , 2e éd. 2004 pp. 255-256 est très déroutant pour moi.

  1. Pourquoi obtenez-vous le devis$\hat{y} = 160 + 0.25(\theta - 160)$donné fixe$\theta$et$\hat{\theta} = 160 + 2(y - 160)$sous échantillonnage répété de$y$sur conditionnelle$\theta$? Je ne sais pas d'où viennent ces équations.

  2. Le problème vient-il ici du fait que la distribution est bivariée (normale) plutôt que$y$ayant une distribution basée sur chaque$\theta$?

Réponses

1 Michael Aug 16 2020 at 06:02
  1. Sur conditionnelle$\theta$, la distribution de$y$est normal avec moyenne$160 + 0.5 (\theta - 160)$. Pour chaque réalisation$y'$à partir de cette distribution conditionnelle, la moyenne a posteriori de$\theta$est$$ \hat\theta(y') = 160 + 0.5 (y' - 160). $$Donc la valeur espérée de$\hat\theta(y')$sur conditionnelle$\theta$est$$ 160 + 0.5 [160 + 0.5 (\theta - 160) - 160] = 160 + 0.25 (\theta - 160). $$

  2. La distribution bivariée est introduite dans l'exemple afin que l'on puisse parler de "... sous échantillonnage répété de$y$sur conditionnelle$θ$...", c'est-à-dire à partir de la distribution conditionnelle de$y$sur$\theta$.

En tout cas, il semble très bayésien, et un peu étrange du point de vue fréquentiste, de parler de "... sous échantillonnage répété de$y$sur conditionnelle$θ$...", où$\theta$est la variable que l'on essaie de prédire.

(Pour un fréquentiste, une prédiction non biaisée signifie la moyenne de la valeur prédite$\hat{\theta}$est égal à la moyenne de la variable$\theta$conditionnel au prédicteur,$E[\theta|y]$.)