Serie temporali - Modellazione

introduzione

Una serie temporale ha 4 componenti come indicato di seguito:

  • Level - È il valore medio attorno al quale varia la serie.

  • Trend - È il comportamento crescente o decrescente di una variabile nel tempo.

  • Seasonality - È il comportamento ciclico delle serie temporali.

  • Noise - È l'errore nelle osservazioni aggiunte dovuto a fattori ambientali.

Tecniche di modellazione delle serie storiche

Per acquisire questi componenti, sono disponibili numerose tecniche di modellazione di serie storiche diffuse. Questa sezione fornisce una breve introduzione di ciascuna tecnica, tuttavia ne discuteremo in dettaglio nei prossimi capitoli:

Metodi naïve

Si tratta di semplici tecniche di stima, ad esempio al valore previsto viene assegnato il valore uguale alla media dei valori precedenti della variabile dipendente dal tempo o il valore effettivo precedente. Questi vengono utilizzati per il confronto con sofisticate tecniche di modellazione.

Regressione automatica

La regressione automatica prevede i valori dei periodi di tempo futuri in funzione dei valori dei periodi di tempo precedenti. Le previsioni di auto regressione possono adattarsi ai dati meglio di quelle dei metodi naïve, ma potrebbero non essere in grado di spiegare la stagionalità.

Modello ARIMA

Una media mobile integrata auto-regressiva modella il valore di una variabile come una funzione lineare dei valori precedenti e degli errori residui nelle fasi temporali precedenti di una serie temporale stazionaria. Tuttavia, i dati del mondo reale possono essere non stazionari e avere una stagionalità, quindi sono stati sviluppati ARIMA stagionale e ARIMA frazionaria. ARIMA lavora su serie storiche univariate, per gestire più variabili è stato introdotto VARIMA.

Livellamento esponenziale

Modella il valore di una variabile come funzione lineare ponderata esponenziale dei valori precedenti. Questo modello statistico può gestire anche trend e stagionalità.

LSTM

Il modello LSTM (Long Short-Term Memory) è una rete neurale ricorrente utilizzata per le serie temporali per tenere conto delle dipendenze a lungo termine. Può essere addestrato con una grande quantità di dati per catturare le tendenze in serie temporali multi-variate.

Le suddette tecniche di modellazione vengono utilizzate per la regressione delle serie temporali. Nei prossimi capitoli, esploriamo ora tutti questi uno per uno.