Différences entre les formules pour AIC et BIC

Aug 22 2020

J'ai une question concernant les critères d'information AIC et BIC :

J'ai trouvé différentes formules pour l'AIC/BIC, les plus courantes incluant la vraisemblance$\mathcal{L}$sont$$AIC = 2K - 2 ln(\mathcal{L})\quad\text{and}\quad BIC =K\;ln(n)- 2 ln(\mathcal{L}).$$Dans "Elements of Forecasting" de Diebold et dans "Econometric Analysis" de Greene, j'ai trouvé des formulations très similaires avec MSE (ou RSS),$$AIC = ln(\frac{RSS}{n}) + \frac{2K}{n} \quad\text{and}\quad BIC = ln(\frac{RSS}{n}) + \frac{K \;ln(n)}{n}.$$Outre le fait que les valeurs obtenues par l'une des premières formules ne sont pas comparables à celles des dernières : en quoi diffèrent-elles ou sont-elles toutes équivalentes ? Supposent-elles toutes une distribution normale ou existe-t-il différentes hypothèses sous-jacentes à ces formules ?

Réponses

2 J.C.Wahl Aug 22 2020 at 20:48

Si vous supposez des erreurs normalement distribuées, la minimisation de l'EQM équivaut à la maximisation de la fonction de vraisemblance. Vos expressions ultérieures pour AIC et BIC sont donc des cas particuliers de la formule générale (jusqu'à une constante proportionnelle):

$$\text{AIC} = 2K - 2 \ln(\mathcal{L})\quad\text{and}\quad \text{BIC} =K\;\ln(n)- 2 \ln(\mathcal{L}).$$

Si vous supposez une distribution différente pour vos données, les estimations de l'EQM ne seront plus les mêmes que les estimations du maximum de vraisemblance, et vous ne pourrez plus utiliser l'EQM à la place de$\mathcal{L}$, puisque ce n'est pas la vraisemblance de votre modèle. Voir cet article pour plus d'informations sur l'utilisation de l'AIC.