आर - सीएसवी फाइलें

आर में, हम आर पर्यावरण के बाहर संग्रहीत फ़ाइलों से डेटा पढ़ सकते हैं। हम डेटा को उन फ़ाइलों में भी लिख सकते हैं जिन्हें ऑपरेटिंग सिस्टम द्वारा संग्रहीत और एक्सेस किया जाएगा। आर सीएसवी, एक्सेल, एक्सएमएल आदि जैसे विभिन्न फ़ाइल स्वरूपों में पढ़ और लिख सकते हैं।

इस अध्याय में हम एक csv फ़ाइल से डेटा पढ़ना सीखेंगे और फिर एक csv फ़ाइल में डेटा लिखेंगे। फ़ाइल को वर्तमान कार्यशील निर्देशिका में मौजूद होना चाहिए ताकि R इसे पढ़ सके। बेशक हम अपनी निर्देशिका भी सेट कर सकते हैं और वहां से फाइलें पढ़ सकते हैं।

कार्य निर्देशिका प्राप्त करना और स्थापित करना

आप जाँच कर सकते हैं कि R किस कार्यक्षेत्र का उपयोग करने के लिए इंगित कर रहा है getwd()समारोह। आप एक नई कार्यशील निर्देशिका का उपयोग करके भी सेट कर सकते हैंsetwd()समारोह।

# Get and print current working directory.
print(getwd())

# Set current working directory.
setwd("/web/com")

# Get and print current working directory.
print(getwd())

जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -

[1] "/web/com/1441086124_2016"
[1] "/web/com"

यह परिणाम आपके OS और आपकी वर्तमान निर्देशिका पर निर्भर करता है जहां आप काम कर रहे हैं।

CSV फ़ाइल के रूप में इनपुट

सीएसवी फाइल एक टेक्स्ट फाइल है जिसमें कॉलम के मान कॉमा द्वारा अलग किए जाते हैं। आइए नाम की फ़ाइल में मौजूद निम्न आंकड़ों पर विचार करेंinput.csv

आप इस डेटा को कॉपी और पेस्ट करके विंडोज नोटपैड का उपयोग करके इस फाइल को बना सकते हैं। फ़ाइल को इस रूप में सहेजेंinput.csv नोटपैड में Save As All files (*। *) ऑप्शन का उपयोग करें।

id,name,salary,start_date,dept
1,Rick,623.3,2012-01-01,IT
2,Dan,515.2,2013-09-23,Operations
3,Michelle,611,2014-11-15,IT
4,Ryan,729,2014-05-11,HR
5,Gary,843.25,2015-03-27,Finance
6,Nina,578,2013-05-21,IT
7,Simon,632.8,2013-07-30,Operations
8,Guru,722.5,2014-06-17,Finance

एक CSV फ़ाइल पढ़ना

निम्नलिखित एक सरल उदाहरण है read.csv() अपनी वर्तमान कार्य निर्देशिका में उपलब्ध CSV फ़ाइल को पढ़ने के लिए कार्य करें -

data <- read.csv("input.csv")
print(data)

जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -

id,   name,    salary,   start_date,     dept
1      1    Rick     623.30    2012-01-01      IT
2      2    Dan      515.20    2013-09-23      Operations
3      3    Michelle 611.00    2014-11-15      IT
4      4    Ryan     729.00    2014-05-11      HR
5     NA    Gary     843.25    2015-03-27      Finance
6      6    Nina     578.00    2013-05-21      IT
7      7    Simon    632.80    2013-07-30      Operations
8      8    Guru     722.50    2014-06-17      Finance

CSV फ़ाइल का विश्लेषण

डिफ़ॉल्ट रूप से read.csv()फ़ंक्शन आउटपुट को डेटा फ़्रेम के रूप में देता है। इसे आसानी से निम्न प्रकार से चेक किया जा सकता है। इसके अलावा, हम कॉलम और पंक्तियों की संख्या की जांच कर सकते हैं।

data <- read.csv("input.csv")

print(is.data.frame(data))
print(ncol(data))
print(nrow(data))

जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -

[1] TRUE
[1] 5
[1] 8

एक बार जब हम डेटा फ़्रेम में डेटा पढ़ते हैं, तो हम बाद के सेक्शन में बताए गए डेटा फ़्रेम्स पर लागू सभी कार्यों को लागू कर सकते हैं।

अधिकतम वेतन प्राप्त करें

# Create a data frame.
data <- read.csv("input.csv")

# Get the max salary from data frame.
sal <- max(data$salary)
print(sal)

जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -

[1] 843.25

अधिकतम वेतन वाले व्यक्ति का विवरण प्राप्त करें

हम पंक्तियों को एक एसक्यूएल के समान विशिष्ट फिल्टर मानदंडों को पूरा कर सकते हैं जहां क्लॉज।

# Create a data frame.
data <- read.csv("input.csv")

# Get the max salary from data frame.
sal <- max(data$salary)

# Get the person detail having max salary.
retval <- subset(data, salary == max(salary))
print(retval)

जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -

id    name  salary  start_date    dept
5     NA    Gary  843.25  2015-03-27    Finance

आईटी विभाग में काम करने वाले सभी लोग प्राप्त करें

# Create a data frame.
data <- read.csv("input.csv")

retval <- subset( data, dept == "IT")
print(retval)

जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -

id   name      salary   start_date   dept
1      1    Rick      623.3    2012-01-01   IT
3      3    Michelle  611.0    2014-11-15   IT
6      6    Nina      578.0    2013-05-21   IT

आईटी विभाग में उन व्यक्तियों को प्राप्त करें जिनका वेतन 600 से अधिक है

# Create a data frame.
data <- read.csv("input.csv")

info <- subset(data, salary > 600 & dept == "IT")
print(info)

जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -

id   name      salary   start_date   dept
1      1    Rick      623.3    2012-01-01   IT
3      3    Michelle  611.0    2014-11-15   IT

2014 के बाद या उससे जुड़े लोगों को प्राप्त करें

# Create a data frame.
data <- read.csv("input.csv")

retval <- subset(data, as.Date(start_date) > as.Date("2014-01-01"))
print(retval)

जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -

id   name     salary   start_date    dept
3      3    Michelle 611.00   2014-11-15    IT
4      4    Ryan     729.00   2014-05-11    HR
5     NA    Gary     843.25   2015-03-27    Finance
8      8    Guru     722.50   2014-06-17    Finance

CSV फ़ाइल में लिखना

आर सीएसवी फ़ाइल फॉर्म मौजूदा डेटा फ्रेम बना सकता है। write.csv()csv फ़ाइल बनाने के लिए फ़ंक्शन का उपयोग किया जाता है। यह फ़ाइल कार्यशील निर्देशिका में बनाई गई है।

# Create a data frame.
data <- read.csv("input.csv")
retval <- subset(data, as.Date(start_date) > as.Date("2014-01-01"))

# Write filtered data into a new file.
write.csv(retval,"output.csv")
newdata <- read.csv("output.csv")
print(newdata)

जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -

X      id   name      salary   start_date    dept
1 3      3    Michelle  611.00   2014-11-15    IT
2 4      4    Ryan      729.00   2014-05-11    HR
3 5     NA    Gary      843.25   2015-03-27    Finance
4 8      8    Guru      722.50   2014-06-17    Finance

यहां कॉलम X डेटा सेट न्यूपर से आता है। फ़ाइल लिखते समय अतिरिक्त मापदंडों का उपयोग करके इसे गिराया जा सकता है।

# Create a data frame.
data <- read.csv("input.csv")
retval <- subset(data, as.Date(start_date) > as.Date("2014-01-01"))

# Write filtered data into a new file.
write.csv(retval,"output.csv", row.names = FALSE)
newdata <- read.csv("output.csv")
print(newdata)

जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -

id    name      salary   start_date    dept
1      3    Michelle  611.00   2014-11-15    IT
2      4    Ryan      729.00   2014-05-11    HR
3     NA    Gary      843.25   2015-03-27    Finance
4      8    Guru      722.50   2014-06-17    Finance