आर - टाइम सीरीज विश्लेषण
समय श्रृंखला डेटा बिंदुओं की एक श्रृंखला है जिसमें प्रत्येक डेटा बिंदु एक टाइमस्टैम्प के साथ जुड़ा हुआ है। एक साधारण उदाहरण स्टॉक मार्केट में किसी दिए गए दिन के विभिन्न बिंदुओं पर स्टॉक की कीमत है। एक और उदाहरण वर्ष के विभिन्न महीनों में एक क्षेत्र में वर्षा की मात्रा है। समय श्रृंखला डेटा को बनाने, हेरफेर करने और साजिश करने के लिए आर भाषा कई कार्यों का उपयोग करती है। टाइम सीरीज़ के डेटा को R ऑब्जेक्ट में संग्रहीत किया जाता है जिसे कहा जाता हैtime-series object। यह एक वेक्टर या डेटा फ्रेम की तरह एक आर डेटा ऑब्जेक्ट भी है।
समय श्रृंखला ऑब्जेक्ट का उपयोग करके बनाया गया है ts() समारोह।
वाक्य - विन्यास
के लिए मूल वाक्यविन्यास ts() समय श्रृंखला विश्लेषण में कार्य है -
timeseries.object.name <- ts(data, start, end, frequency)
निम्नलिखित मापदंडों का वर्णन है -
data एक वेक्टर या मैट्रिक्स है जिसमें समय श्रृंखला में उपयोग किए गए मान हैं।
start समय श्रृंखला में पहली बार अवलोकन के लिए प्रारंभ समय निर्दिष्ट करता है।
end समय श्रृंखला में अंतिम अवलोकन के लिए अंतिम समय निर्दिष्ट करता है।
frequency प्रति यूनिट समय में टिप्पणियों की संख्या निर्दिष्ट करता है।
पैरामीटर "डेटा" को छोड़कर अन्य सभी पैरामीटर वैकल्पिक हैं।
उदाहरण
जनवरी 2012 से शुरू होने वाले स्थान पर वार्षिक वर्षा विवरण पर विचार करें। हम 12 महीने की अवधि के लिए एक आर टाइम सीरीज़ ऑब्जेक्ट बनाते हैं और इसे प्लॉट करते हैं।
# Get the data points in form of a R vector.
rainfall <- c(799,1174.8,865.1,1334.6,635.4,918.5,685.5,998.6,784.2,985,882.8,1071)
# Convert it to a time series object.
rainfall.timeseries <- ts(rainfall,start = c(2012,1),frequency = 12)
# Print the timeseries data.
print(rainfall.timeseries)
# Give the chart file a name.
png(file = "rainfall.png")
# Plot a graph of the time series.
plot(rainfall.timeseries)
# Save the file.
dev.off()
जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम और चार्ट तैयार करता है -
Jan Feb Mar Apr May Jun Jul Aug Sep
2012 799.0 1174.8 865.1 1334.6 635.4 918.5 685.5 998.6 784.2
Oct Nov Dec
2012 985.0 882.8 1071.0
समय श्रृंखला चार्ट -
विभिन्न समय अंतराल
का मूल्य frequencyts () फ़ंक्शन में पैरामीटर उस समय अंतराल को तय करता है जिस पर डेटा बिंदुओं को मापा जाता है। 12 का मान बताता है कि समय श्रृंखला 12 महीनों के लिए है। अन्य मूल्य और इसका अर्थ नीचे दिया गया है -
frequency = 12 एक वर्ष के हर महीने के लिए डेटा बिंदुओं को मापता है।
frequency = 4 एक वर्ष के प्रत्येक तिमाही के लिए डेटा बिंदुओं को मापता है।
frequency = 6 एक घंटे के हर 10 मिनट के लिए डेटा बिंदुओं को मापता है।
frequency = 24*6 दिन के हर 10 मिनट के लिए डेटा बिंदुओं को मापता है।
एकाधिक समय श्रृंखला
हम दोनों श्रृंखलाओं को एक मैट्रिक्स में मिलाकर एक चार्ट में कई बार श्रृंखला की साजिश कर सकते हैं।
# Get the data points in form of a R vector.
rainfall1 <- c(799,1174.8,865.1,1334.6,635.4,918.5,685.5,998.6,784.2,985,882.8,1071)
rainfall2 <-
c(655,1306.9,1323.4,1172.2,562.2,824,822.4,1265.5,799.6,1105.6,1106.7,1337.8)
# Convert them to a matrix.
combined.rainfall <- matrix(c(rainfall1,rainfall2),nrow = 12)
# Convert it to a time series object.
rainfall.timeseries <- ts(combined.rainfall,start = c(2012,1),frequency = 12)
# Print the timeseries data.
print(rainfall.timeseries)
# Give the chart file a name.
png(file = "rainfall_combined.png")
# Plot a graph of the time series.
plot(rainfall.timeseries, main = "Multiple Time Series")
# Save the file.
dev.off()
जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम और चार्ट तैयार करता है -
Series 1 Series 2
Jan 2012 799.0 655.0
Feb 2012 1174.8 1306.9
Mar 2012 865.1 1323.4
Apr 2012 1334.6 1172.2
May 2012 635.4 562.2
Jun 2012 918.5 824.0
Jul 2012 685.5 822.4
Aug 2012 998.6 1265.5
Sep 2012 784.2 799.6
Oct 2012 985.0 1105.6
Nov 2012 882.8 1106.7
Dec 2012 1071.0 1337.8
मल्टीपल टाइम सीरीज़ चार्ट -