Qual é a distinção entre viés na previsão e estimativa de parâmetro?
Estou tentando entender a distinção entre viés na previsão e estimativa de parâmetro. Este exemplo em Gelman, Bayesian Data Analysis , 2ª ed. 2004 pp. 255-256 é muito confuso para mim.
Por que você obtém a estimativa$\hat{y} = 160 + 0.25(\theta - 160)$dado fixo$\theta$e$\hat{\theta} = 160 + 2(y - 160)$sob amostragem repetida de$y$condicional a$\theta$? Não tenho certeza de onde essas equações estão vindo.
O problema aqui decorre do fato de que a distribuição é bivariada (normal) em vez de$y$tendo uma distribuição baseada em cada$\theta$?
Respostas
Condicional em$\theta$, a distribuição de$y$é normal com média$160 + 0.5 (\theta - 160)$. Para cada realização$y'$a partir desta distribuição condicional, a média posterior de$\theta$é$$ \hat\theta(y') = 160 + 0.5 (y' - 160). $$Então o valor esperado de$\hat\theta(y')$condicional a$\theta$é$$ 160 + 0.5 [160 + 0.5 (\theta - 160) - 160] = 160 + 0.25 (\theta - 160). $$
A distribuição bivariada é introduzida no exemplo para que se possa falar sobre "... sob amostragem repetida de$y$condicional a$θ$...", ou seja, da distribuição condicional de$y$sobre$\theta$.
De qualquer forma, parece muito bayesiano, e um pouco estranho do ponto de vista frequentista, falar de "... sob amostragem repetida de$y$condicional a$θ$...", Onde$\theta$é a variável que se está tentando prever.
(Para um frequentista, previsão imparcial significa a média do valor previsto$\hat{\theta}$é igual à média da variável$\theta$condicional ao preditor,$E[\theta|y]$.)