R - Analisi delle serie storiche
Le serie temporali sono una serie di punti dati in cui ogni punto dati è associato a un timestamp. Un semplice esempio è il prezzo di un'azione nel mercato azionario in diversi momenti in un dato giorno. Un altro esempio è la quantità di pioggia in una regione in diversi mesi dell'anno. Il linguaggio R utilizza molte funzioni per creare, manipolare e tracciare i dati delle serie temporali. I dati per la serie temporale vengono archiviati in un oggetto R chiamatotime-series object. È anche un oggetto dati R come un vettore o un data frame.
L'oggetto della serie temporale viene creato utilizzando l'estensione ts() funzione.
Sintassi
La sintassi di base per ts() funzione nell'analisi delle serie temporali è:
timeseries.object.name <- ts(data, start, end, frequency)
Di seguito la descrizione dei parametri utilizzati:
data è un vettore o una matrice contenente i valori utilizzati nelle serie temporali.
start specifica l'ora di inizio per la prima osservazione nelle serie temporali.
end specifica l'ora di fine per l'ultima osservazione nelle serie temporali.
frequency specifica il numero di osservazioni per unità di tempo.
Ad eccezione del parametro "dati", tutti gli altri parametri sono opzionali.
Esempio
Considera i dettagli delle precipitazioni annuali in un luogo a partire da gennaio 2012. Creiamo un oggetto serie temporale R per un periodo di 12 mesi e lo tracciamo.
# Get the data points in form of a R vector.
rainfall <- c(799,1174.8,865.1,1334.6,635.4,918.5,685.5,998.6,784.2,985,882.8,1071)
# Convert it to a time series object.
rainfall.timeseries <- ts(rainfall,start = c(2012,1),frequency = 12)
# Print the timeseries data.
print(rainfall.timeseries)
# Give the chart file a name.
png(file = "rainfall.png")
# Plot a graph of the time series.
plot(rainfall.timeseries)
# Save the file.
dev.off()
Quando eseguiamo il codice sopra, produce il seguente risultato e grafico:
Jan Feb Mar Apr May Jun Jul Aug Sep
2012 799.0 1174.8 865.1 1334.6 635.4 918.5 685.5 998.6 784.2
Oct Nov Dec
2012 985.0 882.8 1071.0
Il grafico delle serie temporali -
Intervalli di tempo diversi
Il valore di frequencyparametro nella funzione ts () decide gli intervalli di tempo in cui vengono misurati i punti dati. Un valore di 12 indica che la serie temporale è per 12 mesi. Altri valori e il loro significato sono i seguenti:
frequency = 12 fissa i punti dati per ogni mese dell'anno.
frequency = 4 fissa i punti dati per ogni trimestre dell'anno.
frequency = 6 fissa i punti dati per ogni 10 minuti di un'ora.
frequency = 24*6 fissa i punti dati per ogni 10 minuti di un giorno.
Serie temporali multiple
Possiamo tracciare più serie temporali in un grafico combinando entrambe le serie in una matrice.
# Get the data points in form of a R vector.
rainfall1 <- c(799,1174.8,865.1,1334.6,635.4,918.5,685.5,998.6,784.2,985,882.8,1071)
rainfall2 <-
c(655,1306.9,1323.4,1172.2,562.2,824,822.4,1265.5,799.6,1105.6,1106.7,1337.8)
# Convert them to a matrix.
combined.rainfall <- matrix(c(rainfall1,rainfall2),nrow = 12)
# Convert it to a time series object.
rainfall.timeseries <- ts(combined.rainfall,start = c(2012,1),frequency = 12)
# Print the timeseries data.
print(rainfall.timeseries)
# Give the chart file a name.
png(file = "rainfall_combined.png")
# Plot a graph of the time series.
plot(rainfall.timeseries, main = "Multiple Time Series")
# Save the file.
dev.off()
Quando eseguiamo il codice sopra, produce il seguente risultato e grafico:
Series 1 Series 2
Jan 2012 799.0 655.0
Feb 2012 1174.8 1306.9
Mar 2012 865.1 1323.4
Apr 2012 1334.6 1172.2
May 2012 635.4 562.2
Jun 2012 918.5 824.0
Jul 2012 685.5 822.4
Aug 2012 998.6 1265.5
Sep 2012 784.2 799.6
Oct 2012 985.0 1105.6
Nov 2012 882.8 1106.7
Dec 2012 1071.0 1337.8
Il grafico delle serie temporali multiple -