Série chronologique - Calibrage des paramètres

introduction

Tout modèle statistique ou d'apprentissage automatique a des paramètres qui influencent grandement la façon dont les données sont modélisées. Par exemple, ARIMA a des valeurs p, d, q. Ces paramètres doivent être décidés de telle sorte que l'erreur entre les valeurs réelles et les valeurs modélisées soit minimale. L'étalonnage des paramètres est considéré comme la tâche la plus cruciale et la plus longue de l'ajustement du modèle. Par conséquent, il est très essentiel pour nous de choisir des paramètres optimaux.

Méthodes d'étalonnage des paramètres

Il existe différentes manières de calibrer les paramètres. Cette section décrit certains d'entre eux en détail.

Hit-and-try

Un moyen courant d'étalonner les modèles est l'étalonnage manuel, où vous commencez par visualiser la série chronologique et essayez intuitivement certaines valeurs de paramètres et changez-les encore et encore jusqu'à ce que vous obteniez un ajustement suffisant. Cela nécessite une bonne compréhension du modèle que nous essayons. Pour le modèle ARIMA, l'étalonnage manuel est effectué à l'aide d'un tracé d'auto-corrélation pour le paramètre `` p '', d'un tracé d'auto-corrélation partielle pour le paramètre `` q '' et d'un test ADF pour confirmer la stationnarité de la série chronologique et le réglage du paramètre `` d '' . Nous discuterons de tout cela en détail dans les prochains chapitres.

Recherche de grille

Une autre façon de calibrer les modèles est la recherche de grille, ce qui signifie essentiellement que vous essayez de créer un modèle pour toutes les combinaisons possibles de paramètres et de sélectionner celle avec le moins d'erreur. Cela prend du temps et est donc utile lorsque le nombre de paramètres à calibrer et la plage de valeurs qu'ils prennent sont moins nombreux, car cela implique plusieurs boucles for imbriquées.

Algorithme génétique

L'algorithme génétique fonctionne sur le principe biologique qu'une bonne solution évoluera éventuellement vers la solution la plus «optimale». Il utilise des opérations biologiques de mutation, de croisement et de sélection pour enfin parvenir à une solution optimale.

Pour plus d'informations, vous pouvez consulter d'autres techniques d'optimisation des paramètres comme l'optimisation bayésienne et l'optimisation Swarm.