R - Analyse des séries chronologiques

La série chronologique est une série de points de données dans laquelle chaque point de données est associé à un horodatage. Un exemple simple est le prix d'une action sur le marché boursier à différents moments d'un jour donné. Un autre exemple est la quantité de précipitations dans une région à différents mois de l'année. Le langage R utilise de nombreuses fonctions pour créer, manipuler et tracer les données de séries chronologiques. Les données de la série chronologique sont stockées dans un objet R appelétime-series object. C'est aussi un objet de données R comme un vecteur ou une trame de données.

L'objet série chronologique est créé à l'aide de ts() fonction.

Syntaxe

La syntaxe de base pour ts() La fonction dans l'analyse des séries chronologiques est -

timeseries.object.name <-  ts(data, start, end, frequency)

Voici la description des paramètres utilisés -

  • data est un vecteur ou une matrice contenant les valeurs utilisées dans la série chronologique.

  • start spécifie l'heure de début de la première observation de la série chronologique.

  • end spécifie l'heure de fin de la dernière observation de la série chronologique.

  • frequency spécifie le nombre d'observations par unité de temps.

A l'exception du paramètre "data", tous les autres paramètres sont facultatifs.

Exemple

Considérez les détails des précipitations annuelles à un endroit à partir de janvier 2012. Nous créons un objet de série temporelle R pour une période de 12 mois et le tracons.

# Get the data points in form of a R vector.
rainfall <- c(799,1174.8,865.1,1334.6,635.4,918.5,685.5,998.6,784.2,985,882.8,1071)

# Convert it to a time series object.
rainfall.timeseries <- ts(rainfall,start = c(2012,1),frequency = 12)

# Print the timeseries data.
print(rainfall.timeseries)

# Give the chart file a name.
png(file = "rainfall.png")

# Plot a graph of the time series.
plot(rainfall.timeseries)

# Save the file.
dev.off()

Lorsque nous exécutons le code ci-dessus, il produit le résultat et le graphique suivants -

Jan    Feb    Mar    Apr    May     Jun    Jul    Aug    Sep
2012  799.0  1174.8  865.1  1334.6  635.4  918.5  685.5  998.6  784.2
        Oct    Nov    Dec
2012  985.0  882.8 1071.0

Le graphique des séries chronologiques -

Différents intervalles de temps

La valeur du frequencyLe paramètre de la fonction ts () décide des intervalles de temps auxquels les points de données sont mesurés. Une valeur de 12 indique que la série chronologique porte sur 12 mois. Les autres valeurs et leur signification sont comme ci-dessous -

  • frequency = 12 calcule les points de données pour chaque mois de l'année.

  • frequency = 4 fixe les points de données pour chaque trimestre de l'année.

  • frequency = 6 fixe les points de données toutes les 10 minutes d'une heure.

  • frequency = 24*6 associe les points de données toutes les 10 minutes par jour.

Séries chronologiques multiples

Nous pouvons tracer plusieurs séries temporelles dans un graphique en combinant les deux séries dans une matrice.

# Get the data points in form of a R vector.
rainfall1 <- c(799,1174.8,865.1,1334.6,635.4,918.5,685.5,998.6,784.2,985,882.8,1071)
rainfall2 <- 
           c(655,1306.9,1323.4,1172.2,562.2,824,822.4,1265.5,799.6,1105.6,1106.7,1337.8)

# Convert them to a matrix.
combined.rainfall <-  matrix(c(rainfall1,rainfall2),nrow = 12)

# Convert it to a time series object.
rainfall.timeseries <- ts(combined.rainfall,start = c(2012,1),frequency = 12)

# Print the timeseries data.
print(rainfall.timeseries)

# Give the chart file a name.
png(file = "rainfall_combined.png")

# Plot a graph of the time series.
plot(rainfall.timeseries, main = "Multiple Time Series")

# Save the file.
dev.off()

Lorsque nous exécutons le code ci-dessus, il produit le résultat et le graphique suivants -

Series 1  Series 2
Jan 2012    799.0    655.0
Feb 2012   1174.8   1306.9
Mar 2012    865.1   1323.4
Apr 2012   1334.6   1172.2
May 2012    635.4    562.2
Jun 2012    918.5    824.0
Jul 2012    685.5    822.4
Aug 2012    998.6   1265.5
Sep 2012    784.2    799.6
Oct 2012    985.0   1105.6
Nov 2012    882.8   1106.7
Dec 2012   1071.0   1337.8

Le graphique de séries chronologiques multiples -