R - Analisi delle serie storiche

Le serie temporali sono una serie di punti dati in cui ogni punto dati è associato a un timestamp. Un semplice esempio è il prezzo di un'azione nel mercato azionario in diversi momenti in un dato giorno. Un altro esempio è la quantità di pioggia in una regione in diversi mesi dell'anno. Il linguaggio R utilizza molte funzioni per creare, manipolare e tracciare i dati delle serie temporali. I dati per la serie temporale vengono archiviati in un oggetto R chiamatotime-series object. È anche un oggetto dati R come un vettore o un data frame.

L'oggetto della serie temporale viene creato utilizzando l'estensione ts() funzione.

Sintassi

La sintassi di base per ts() funzione nell'analisi delle serie temporali è:

timeseries.object.name <-  ts(data, start, end, frequency)

Di seguito la descrizione dei parametri utilizzati:

  • data è un vettore o una matrice contenente i valori utilizzati nelle serie temporali.

  • start specifica l'ora di inizio per la prima osservazione nelle serie temporali.

  • end specifica l'ora di fine per l'ultima osservazione nelle serie temporali.

  • frequency specifica il numero di osservazioni per unità di tempo.

Ad eccezione del parametro "dati", tutti gli altri parametri sono opzionali.

Esempio

Considera i dettagli delle precipitazioni annuali in un luogo a partire da gennaio 2012. Creiamo un oggetto serie temporale R per un periodo di 12 mesi e lo tracciamo.

# Get the data points in form of a R vector.
rainfall <- c(799,1174.8,865.1,1334.6,635.4,918.5,685.5,998.6,784.2,985,882.8,1071)

# Convert it to a time series object.
rainfall.timeseries <- ts(rainfall,start = c(2012,1),frequency = 12)

# Print the timeseries data.
print(rainfall.timeseries)

# Give the chart file a name.
png(file = "rainfall.png")

# Plot a graph of the time series.
plot(rainfall.timeseries)

# Save the file.
dev.off()

Quando eseguiamo il codice sopra, produce il seguente risultato e grafico:

Jan    Feb    Mar    Apr    May     Jun    Jul    Aug    Sep
2012  799.0  1174.8  865.1  1334.6  635.4  918.5  685.5  998.6  784.2
        Oct    Nov    Dec
2012  985.0  882.8 1071.0

Il grafico delle serie temporali -

Intervalli di tempo diversi

Il valore di frequencyparametro nella funzione ts () decide gli intervalli di tempo in cui vengono misurati i punti dati. Un valore di 12 indica che la serie temporale è per 12 mesi. Altri valori e il loro significato sono i seguenti:

  • frequency = 12 fissa i punti dati per ogni mese dell'anno.

  • frequency = 4 fissa i punti dati per ogni trimestre dell'anno.

  • frequency = 6 fissa i punti dati per ogni 10 minuti di un'ora.

  • frequency = 24*6 fissa i punti dati per ogni 10 minuti di un giorno.

Serie temporali multiple

Possiamo tracciare più serie temporali in un grafico combinando entrambe le serie in una matrice.

# Get the data points in form of a R vector.
rainfall1 <- c(799,1174.8,865.1,1334.6,635.4,918.5,685.5,998.6,784.2,985,882.8,1071)
rainfall2 <- 
           c(655,1306.9,1323.4,1172.2,562.2,824,822.4,1265.5,799.6,1105.6,1106.7,1337.8)

# Convert them to a matrix.
combined.rainfall <-  matrix(c(rainfall1,rainfall2),nrow = 12)

# Convert it to a time series object.
rainfall.timeseries <- ts(combined.rainfall,start = c(2012,1),frequency = 12)

# Print the timeseries data.
print(rainfall.timeseries)

# Give the chart file a name.
png(file = "rainfall_combined.png")

# Plot a graph of the time series.
plot(rainfall.timeseries, main = "Multiple Time Series")

# Save the file.
dev.off()

Quando eseguiamo il codice sopra, produce il seguente risultato e grafico:

Series 1  Series 2
Jan 2012    799.0    655.0
Feb 2012   1174.8   1306.9
Mar 2012    865.1   1323.4
Apr 2012   1334.6   1172.2
May 2012    635.4    562.2
Jun 2012    918.5    824.0
Jul 2012    685.5    822.4
Aug 2012    998.6   1265.5
Sep 2012    784.2    799.6
Oct 2012    985.0   1105.6
Nov 2012    882.8   1106.7
Dec 2012   1071.0   1337.8

Il grafico delle serie temporali multiple -