Série chronologique - Mesures d'erreur
Il est important pour nous de quantifier les performances d'un modèle pour l'utiliser comme retour et comparaison. Dans ce didacticiel, nous avons utilisé l'une des erreurs quadratiques moyennes les plus courantes. Il existe diverses autres mesures d'erreur disponibles. Ce chapitre les aborde brièvement.
Erreur quadratique moyenne
C'est la moyenne du carré de la différence entre les valeurs prédites et les valeurs vraies. Sklearn le fournit en tant que fonction. Il a les mêmes unités que les valeurs vraie et prédite au carré et est toujours positif.
$$ MSE = \ frac {1} {n} \ displaystyle \ sum \ limits_ {t = 1} ^ n \ lgroup y '_ {t} \: - y_ {t} \ rgroup ^ {2} $$
Où $ y '_ {t} $ est la valeur prédite,
$ y_ {t} $ est la valeur réelle, et
n est le nombre total de valeurs dans l'ensemble de test.
Il ressort clairement de l'équation que MSE est plus pénalisante pour les erreurs plus importantes, ou les valeurs aberrantes.
Erreur quadratique moyenne
C'est la racine carrée de l'erreur quadratique moyenne. Il est également toujours positif et se situe dans la plage des données.
$$ RMSE = \ sqrt {\ frac {1} {n} \ displaystyle \ sum \ limits_ {t = 1} ^ n \ lgroup y '_ {t} -y_ {t} \ rgroup ^ 2} $$
Où, $ y '_ {t} $ est la valeur prévue
$ y_ {t} $ est la valeur réelle, et
n est le nombre total de valeurs dans l'ensemble de test.
Il est au pouvoir de l'unité et est donc plus interprétable par rapport à MSE. RMSE est également plus pénalisant pour les erreurs plus importantes. Nous avons utilisé la métrique RMSE dans notre tutoriel.
Erreur absolue moyenne
C'est la moyenne de la différence absolue entre les valeurs prédites et les valeurs vraies. Il a les mêmes unités que la valeur prévue et vraie et est toujours positif.
$$ MAE = \ frac {1} {n} \ Displaystyle \ sum \ limits_ {t = 1} ^ {t = n} | y '{t} -y_ {t} \ lvert $$
Où, $ y '_ {t} $ est la valeur prévue,
$ y_ {t} $ est la valeur réelle, et
n est le nombre total de valeurs dans l'ensemble de test.
Erreur moyenne en pourcentage
Il s'agit du pourcentage de la moyenne de la différence absolue entre les valeurs prédites et les valeurs réelles, divisé par la valeur réelle.
$$ MAPE = \ frac {1} {n} \ displaystyle \ sum \ limits_ {t = 1} ^ n \ frac {y '_ {t} -y_ {t}} {y_ {t}} * 100 \: \% $$
Où, $ y '_ {t} $ est la valeur prévue,
$ y_ {t} $ est la valeur réelle et n est le nombre total de valeurs dans l'ensemble de test.
Cependant, l’inconvénient de l’utilisation de cette erreur est que l’erreur positive et les erreurs négatives peuvent se compenser. Par conséquent, l'erreur en pourcentage absolue moyenne est utilisée.
Erreur de pourcentage absolu moyen
Il s'agit du pourcentage de la moyenne de la différence absolue entre les valeurs prédites et les valeurs réelles, divisé par la valeur réelle.
$$ MAPE = \ frac {1} {n} \ displaystyle \ sum \ limits_ {t = 1} ^ n \ frac {| y '_ {t} -y_ {t} \ lvert} {y_ {t}} * 100 \: \% $$
Où $ y '_ {t} $ est la valeur prévue
$ y_ {t} $ est la valeur réelle, et
n est le nombre total de valeurs dans l'ensemble de test.