आर - टाइम सीरीज विश्लेषण

समय श्रृंखला डेटा बिंदुओं की एक श्रृंखला है जिसमें प्रत्येक डेटा बिंदु एक टाइमस्टैम्प के साथ जुड़ा हुआ है। एक साधारण उदाहरण स्टॉक मार्केट में किसी दिए गए दिन के विभिन्न बिंदुओं पर स्टॉक की कीमत है। एक और उदाहरण वर्ष के विभिन्न महीनों में एक क्षेत्र में वर्षा की मात्रा है। समय श्रृंखला डेटा को बनाने, हेरफेर करने और साजिश करने के लिए आर भाषा कई कार्यों का उपयोग करती है। टाइम सीरीज़ के डेटा को R ऑब्जेक्ट में संग्रहीत किया जाता है जिसे कहा जाता हैtime-series object। यह एक वेक्टर या डेटा फ्रेम की तरह एक आर डेटा ऑब्जेक्ट भी है।

समय श्रृंखला ऑब्जेक्ट का उपयोग करके बनाया गया है ts() समारोह।

वाक्य - विन्यास

के लिए मूल वाक्यविन्यास ts() समय श्रृंखला विश्लेषण में कार्य है -

timeseries.object.name <-  ts(data, start, end, frequency)

निम्नलिखित मापदंडों का वर्णन है -

  • data एक वेक्टर या मैट्रिक्स है जिसमें समय श्रृंखला में उपयोग किए गए मान हैं।

  • start समय श्रृंखला में पहली बार अवलोकन के लिए प्रारंभ समय निर्दिष्ट करता है।

  • end समय श्रृंखला में अंतिम अवलोकन के लिए अंतिम समय निर्दिष्ट करता है।

  • frequency प्रति यूनिट समय में टिप्पणियों की संख्या निर्दिष्ट करता है।

पैरामीटर "डेटा" को छोड़कर अन्य सभी पैरामीटर वैकल्पिक हैं।

उदाहरण

जनवरी 2012 से शुरू होने वाले स्थान पर वार्षिक वर्षा विवरण पर विचार करें। हम 12 महीने की अवधि के लिए एक आर टाइम सीरीज़ ऑब्जेक्ट बनाते हैं और इसे प्लॉट करते हैं।

# Get the data points in form of a R vector.
rainfall <- c(799,1174.8,865.1,1334.6,635.4,918.5,685.5,998.6,784.2,985,882.8,1071)

# Convert it to a time series object.
rainfall.timeseries <- ts(rainfall,start = c(2012,1),frequency = 12)

# Print the timeseries data.
print(rainfall.timeseries)

# Give the chart file a name.
png(file = "rainfall.png")

# Plot a graph of the time series.
plot(rainfall.timeseries)

# Save the file.
dev.off()

जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम और चार्ट तैयार करता है -

Jan    Feb    Mar    Apr    May     Jun    Jul    Aug    Sep
2012  799.0  1174.8  865.1  1334.6  635.4  918.5  685.5  998.6  784.2
        Oct    Nov    Dec
2012  985.0  882.8 1071.0

समय श्रृंखला चार्ट -

विभिन्न समय अंतराल

का मूल्य frequencyts () फ़ंक्शन में पैरामीटर उस समय अंतराल को तय करता है जिस पर डेटा बिंदुओं को मापा जाता है। 12 का मान बताता है कि समय श्रृंखला 12 महीनों के लिए है। अन्य मूल्य और इसका अर्थ नीचे दिया गया है -

  • frequency = 12 एक वर्ष के हर महीने के लिए डेटा बिंदुओं को मापता है।

  • frequency = 4 एक वर्ष के प्रत्येक तिमाही के लिए डेटा बिंदुओं को मापता है।

  • frequency = 6 एक घंटे के हर 10 मिनट के लिए डेटा बिंदुओं को मापता है।

  • frequency = 24*6 दिन के हर 10 मिनट के लिए डेटा बिंदुओं को मापता है।

एकाधिक समय श्रृंखला

हम दोनों श्रृंखलाओं को एक मैट्रिक्स में मिलाकर एक चार्ट में कई बार श्रृंखला की साजिश कर सकते हैं।

# Get the data points in form of a R vector.
rainfall1 <- c(799,1174.8,865.1,1334.6,635.4,918.5,685.5,998.6,784.2,985,882.8,1071)
rainfall2 <- 
           c(655,1306.9,1323.4,1172.2,562.2,824,822.4,1265.5,799.6,1105.6,1106.7,1337.8)

# Convert them to a matrix.
combined.rainfall <-  matrix(c(rainfall1,rainfall2),nrow = 12)

# Convert it to a time series object.
rainfall.timeseries <- ts(combined.rainfall,start = c(2012,1),frequency = 12)

# Print the timeseries data.
print(rainfall.timeseries)

# Give the chart file a name.
png(file = "rainfall_combined.png")

# Plot a graph of the time series.
plot(rainfall.timeseries, main = "Multiple Time Series")

# Save the file.
dev.off()

जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम और चार्ट तैयार करता है -

Series 1  Series 2
Jan 2012    799.0    655.0
Feb 2012   1174.8   1306.9
Mar 2012    865.1   1323.4
Apr 2012   1334.6   1172.2
May 2012    635.4    562.2
Jun 2012    918.5    824.0
Jul 2012    685.5    822.4
Aug 2012    998.6   1265.5
Sep 2012    784.2    799.6
Oct 2012    985.0   1105.6
Nov 2012    882.8   1106.7
Dec 2012   1071.0   1337.8

मल्टीपल टाइम सीरीज़ चार्ट -