Serie storica - Calibrazione dei parametri
introduzione
Qualsiasi modello statistico o di apprendimento automatico ha alcuni parametri che influenzano notevolmente il modo in cui i dati vengono modellati. Ad esempio, ARIMA ha valori p, d, q. Questi parametri devono essere decisi in modo tale che l'errore tra i valori effettivi e quelli modellati sia minimo. Si dice che la calibrazione dei parametri sia l'attività più cruciale e dispendiosa in termini di tempo per l'adattamento del modello. Quindi, è molto essenziale per noi scegliere i parametri ottimali.
Metodi per la calibrazione dei parametri
Esistono vari modi per calibrare i parametri. Questa sezione parla di alcuni di essi in dettaglio.
Hit-and-try
Un modo comune per calibrare i modelli è la calibrazione manuale, in cui si inizia visualizzando le serie temporali e provando intuitivamente alcuni valori dei parametri e modificandoli più e più volte fino a ottenere un adattamento sufficientemente buono. Richiede una buona comprensione del modello che stiamo provando. Per il modello ARIMA, la calibrazione della mano viene eseguita con l'aiuto del grafico di auto-correlazione per il parametro 'p', il grafico di auto-correlazione parziale per il parametro 'q' e il test ADF per confermare la stazionarietà delle serie temporali e l'impostazione del parametro 'd' . Discuteremo tutto questo in dettaglio nei prossimi capitoli.
Grid Search
Un altro modo per calibrare i modelli è la ricerca sulla griglia, il che significa essenzialmente provare a costruire un modello per tutte le possibili combinazioni di parametri e selezionare quello con il minimo errore. Ciò richiede tempo e quindi è utile quando il numero di parametri da calibrare e l'intervallo di valori che assumono sono inferiori poiché ciò comporta più cicli for annidati.
Algoritmo genetico
L'algoritmo genetico si basa sul principio biologico che una buona soluzione alla fine evolverà verso la soluzione più "ottimale". Utilizza operazioni biologiche di mutazione, cross-over e selezione per arrivare finalmente ad una soluzione ottimale.
Per ulteriori conoscenze puoi leggere altre tecniche di ottimizzazione dei parametri come l'ottimizzazione bayesiana e l'ottimizzazione Swarm.