आर - सीएसवी फाइलें
आर में, हम आर पर्यावरण के बाहर संग्रहीत फ़ाइलों से डेटा पढ़ सकते हैं। हम डेटा को उन फ़ाइलों में भी लिख सकते हैं जिन्हें ऑपरेटिंग सिस्टम द्वारा संग्रहीत और एक्सेस किया जाएगा। आर सीएसवी, एक्सेल, एक्सएमएल आदि जैसे विभिन्न फ़ाइल स्वरूपों में पढ़ और लिख सकते हैं।
इस अध्याय में हम एक csv फ़ाइल से डेटा पढ़ना सीखेंगे और फिर एक csv फ़ाइल में डेटा लिखेंगे। फ़ाइल को वर्तमान कार्यशील निर्देशिका में मौजूद होना चाहिए ताकि R इसे पढ़ सके। बेशक हम अपनी निर्देशिका भी सेट कर सकते हैं और वहां से फाइलें पढ़ सकते हैं।
कार्य निर्देशिका प्राप्त करना और स्थापित करना
आप जाँच कर सकते हैं कि R किस कार्यक्षेत्र का उपयोग करने के लिए इंगित कर रहा है getwd()समारोह। आप एक नई कार्यशील निर्देशिका का उपयोग करके भी सेट कर सकते हैंsetwd()समारोह।
# Get and print current working directory.
print(getwd())
# Set current working directory.
setwd("/web/com")
# Get and print current working directory.
print(getwd())
जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -
[1] "/web/com/1441086124_2016"
[1] "/web/com"
यह परिणाम आपके OS और आपकी वर्तमान निर्देशिका पर निर्भर करता है जहां आप काम कर रहे हैं।
CSV फ़ाइल के रूप में इनपुट
सीएसवी फाइल एक टेक्स्ट फाइल है जिसमें कॉलम के मान कॉमा द्वारा अलग किए जाते हैं। आइए नाम की फ़ाइल में मौजूद निम्न आंकड़ों पर विचार करेंinput.csv।
आप इस डेटा को कॉपी और पेस्ट करके विंडोज नोटपैड का उपयोग करके इस फाइल को बना सकते हैं। फ़ाइल को इस रूप में सहेजेंinput.csv नोटपैड में Save As All files (*। *) ऑप्शन का उपयोग करें।
id,name,salary,start_date,dept
1,Rick,623.3,2012-01-01,IT
2,Dan,515.2,2013-09-23,Operations
3,Michelle,611,2014-11-15,IT
4,Ryan,729,2014-05-11,HR
5,Gary,843.25,2015-03-27,Finance
6,Nina,578,2013-05-21,IT
7,Simon,632.8,2013-07-30,Operations
8,Guru,722.5,2014-06-17,Finance
एक CSV फ़ाइल पढ़ना
निम्नलिखित एक सरल उदाहरण है read.csv() अपनी वर्तमान कार्य निर्देशिका में उपलब्ध CSV फ़ाइल को पढ़ने के लिए कार्य करें -
data <- read.csv("input.csv")
print(data)
जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -
id, name, salary, start_date, dept
1 1 Rick 623.30 2012-01-01 IT
2 2 Dan 515.20 2013-09-23 Operations
3 3 Michelle 611.00 2014-11-15 IT
4 4 Ryan 729.00 2014-05-11 HR
5 NA Gary 843.25 2015-03-27 Finance
6 6 Nina 578.00 2013-05-21 IT
7 7 Simon 632.80 2013-07-30 Operations
8 8 Guru 722.50 2014-06-17 Finance
CSV फ़ाइल का विश्लेषण
डिफ़ॉल्ट रूप से read.csv()फ़ंक्शन आउटपुट को डेटा फ़्रेम के रूप में देता है। इसे आसानी से निम्न प्रकार से चेक किया जा सकता है। इसके अलावा, हम कॉलम और पंक्तियों की संख्या की जांच कर सकते हैं।
data <- read.csv("input.csv")
print(is.data.frame(data))
print(ncol(data))
print(nrow(data))
जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -
[1] TRUE
[1] 5
[1] 8
एक बार जब हम डेटा फ़्रेम में डेटा पढ़ते हैं, तो हम बाद के सेक्शन में बताए गए डेटा फ़्रेम्स पर लागू सभी कार्यों को लागू कर सकते हैं।
अधिकतम वेतन प्राप्त करें
# Create a data frame.
data <- read.csv("input.csv")
# Get the max salary from data frame.
sal <- max(data$salary)
print(sal)
जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -
[1] 843.25
अधिकतम वेतन वाले व्यक्ति का विवरण प्राप्त करें
हम पंक्तियों को एक एसक्यूएल के समान विशिष्ट फिल्टर मानदंडों को पूरा कर सकते हैं जहां क्लॉज।
# Create a data frame.
data <- read.csv("input.csv")
# Get the max salary from data frame.
sal <- max(data$salary)
# Get the person detail having max salary.
retval <- subset(data, salary == max(salary))
print(retval)
जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -
id name salary start_date dept
5 NA Gary 843.25 2015-03-27 Finance
आईटी विभाग में काम करने वाले सभी लोग प्राप्त करें
# Create a data frame.
data <- read.csv("input.csv")
retval <- subset( data, dept == "IT")
print(retval)
जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -
id name salary start_date dept
1 1 Rick 623.3 2012-01-01 IT
3 3 Michelle 611.0 2014-11-15 IT
6 6 Nina 578.0 2013-05-21 IT
आईटी विभाग में उन व्यक्तियों को प्राप्त करें जिनका वेतन 600 से अधिक है
# Create a data frame.
data <- read.csv("input.csv")
info <- subset(data, salary > 600 & dept == "IT")
print(info)
जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -
id name salary start_date dept
1 1 Rick 623.3 2012-01-01 IT
3 3 Michelle 611.0 2014-11-15 IT
2014 के बाद या उससे जुड़े लोगों को प्राप्त करें
# Create a data frame.
data <- read.csv("input.csv")
retval <- subset(data, as.Date(start_date) > as.Date("2014-01-01"))
print(retval)
जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -
id name salary start_date dept
3 3 Michelle 611.00 2014-11-15 IT
4 4 Ryan 729.00 2014-05-11 HR
5 NA Gary 843.25 2015-03-27 Finance
8 8 Guru 722.50 2014-06-17 Finance
CSV फ़ाइल में लिखना
आर सीएसवी फ़ाइल फॉर्म मौजूदा डेटा फ्रेम बना सकता है। write.csv()csv फ़ाइल बनाने के लिए फ़ंक्शन का उपयोग किया जाता है। यह फ़ाइल कार्यशील निर्देशिका में बनाई गई है।
# Create a data frame.
data <- read.csv("input.csv")
retval <- subset(data, as.Date(start_date) > as.Date("2014-01-01"))
# Write filtered data into a new file.
write.csv(retval,"output.csv")
newdata <- read.csv("output.csv")
print(newdata)
जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -
X id name salary start_date dept
1 3 3 Michelle 611.00 2014-11-15 IT
2 4 4 Ryan 729.00 2014-05-11 HR
3 5 NA Gary 843.25 2015-03-27 Finance
4 8 8 Guru 722.50 2014-06-17 Finance
यहां कॉलम X डेटा सेट न्यूपर से आता है। फ़ाइल लिखते समय अतिरिक्त मापदंडों का उपयोग करके इसे गिराया जा सकता है।
# Create a data frame.
data <- read.csv("input.csv")
retval <- subset(data, as.Date(start_date) > as.Date("2014-01-01"))
# Write filtered data into a new file.
write.csv(retval,"output.csv", row.names = FALSE)
newdata <- read.csv("output.csv")
print(newdata)
जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -
id name salary start_date dept
1 3 Michelle 611.00 2014-11-15 IT
2 4 Ryan 729.00 2014-05-11 HR
3 NA Gary 843.25 2015-03-27 Finance
4 8 Guru 722.50 2014-06-17 Finance