R - Analyse des séries chronologiques
La série chronologique est une série de points de données dans laquelle chaque point de données est associé à un horodatage. Un exemple simple est le prix d'une action sur le marché boursier à différents moments d'un jour donné. Un autre exemple est la quantité de précipitations dans une région à différents mois de l'année. Le langage R utilise de nombreuses fonctions pour créer, manipuler et tracer les données de séries chronologiques. Les données de la série chronologique sont stockées dans un objet R appelétime-series object. C'est aussi un objet de données R comme un vecteur ou une trame de données.
L'objet série chronologique est créé à l'aide de ts() fonction.
Syntaxe
La syntaxe de base pour ts() La fonction dans l'analyse des séries chronologiques est -
timeseries.object.name <- ts(data, start, end, frequency)
Voici la description des paramètres utilisés -
data est un vecteur ou une matrice contenant les valeurs utilisées dans la série chronologique.
start spécifie l'heure de début de la première observation de la série chronologique.
end spécifie l'heure de fin de la dernière observation de la série chronologique.
frequency spécifie le nombre d'observations par unité de temps.
A l'exception du paramètre "data", tous les autres paramètres sont facultatifs.
Exemple
Considérez les détails des précipitations annuelles à un endroit à partir de janvier 2012. Nous créons un objet de série temporelle R pour une période de 12 mois et le tracons.
# Get the data points in form of a R vector.
rainfall <- c(799,1174.8,865.1,1334.6,635.4,918.5,685.5,998.6,784.2,985,882.8,1071)
# Convert it to a time series object.
rainfall.timeseries <- ts(rainfall,start = c(2012,1),frequency = 12)
# Print the timeseries data.
print(rainfall.timeseries)
# Give the chart file a name.
png(file = "rainfall.png")
# Plot a graph of the time series.
plot(rainfall.timeseries)
# Save the file.
dev.off()
Lorsque nous exécutons le code ci-dessus, il produit le résultat et le graphique suivants -
Jan Feb Mar Apr May Jun Jul Aug Sep
2012 799.0 1174.8 865.1 1334.6 635.4 918.5 685.5 998.6 784.2
Oct Nov Dec
2012 985.0 882.8 1071.0
Le graphique des séries chronologiques -
Différents intervalles de temps
La valeur du frequencyLe paramètre de la fonction ts () décide des intervalles de temps auxquels les points de données sont mesurés. Une valeur de 12 indique que la série chronologique porte sur 12 mois. Les autres valeurs et leur signification sont comme ci-dessous -
frequency = 12 calcule les points de données pour chaque mois de l'année.
frequency = 4 fixe les points de données pour chaque trimestre de l'année.
frequency = 6 fixe les points de données toutes les 10 minutes d'une heure.
frequency = 24*6 associe les points de données toutes les 10 minutes par jour.
Séries chronologiques multiples
Nous pouvons tracer plusieurs séries temporelles dans un graphique en combinant les deux séries dans une matrice.
# Get the data points in form of a R vector.
rainfall1 <- c(799,1174.8,865.1,1334.6,635.4,918.5,685.5,998.6,784.2,985,882.8,1071)
rainfall2 <-
c(655,1306.9,1323.4,1172.2,562.2,824,822.4,1265.5,799.6,1105.6,1106.7,1337.8)
# Convert them to a matrix.
combined.rainfall <- matrix(c(rainfall1,rainfall2),nrow = 12)
# Convert it to a time series object.
rainfall.timeseries <- ts(combined.rainfall,start = c(2012,1),frequency = 12)
# Print the timeseries data.
print(rainfall.timeseries)
# Give the chart file a name.
png(file = "rainfall_combined.png")
# Plot a graph of the time series.
plot(rainfall.timeseries, main = "Multiple Time Series")
# Save the file.
dev.off()
Lorsque nous exécutons le code ci-dessus, il produit le résultat et le graphique suivants -
Series 1 Series 2
Jan 2012 799.0 655.0
Feb 2012 1174.8 1306.9
Mar 2012 865.1 1323.4
Apr 2012 1334.6 1172.2
May 2012 635.4 562.2
Jun 2012 918.5 824.0
Jul 2012 685.5 822.4
Aug 2012 998.6 1265.5
Sep 2012 784.2 799.6
Oct 2012 985.0 1105.6
Nov 2012 882.8 1106.7
Dec 2012 1071.0 1337.8
Le graphique de séries chronologiques multiples -