आर - एक्सेल फाइल

Microsoft Excel सबसे अधिक उपयोग किया जाने वाला स्प्रेडशीट प्रोग्राम है जो डेटा को .xls या .xlsx प्रारूप में संग्रहीत करता है। कुछ एक्सेल विशिष्ट पैकेजों का उपयोग करके इन फाइलों से सीधे पढ़ा जा सकता है। कुछ ऐसे पैकेज हैं - XLConnect, xlsx, gdata आदि। हम xlsx पैकेज का उपयोग करेंगे। R इस पैकेज का उपयोग करके एक्सेल फाइल में भी लिख सकता है।

Xlsx पैकेज स्थापित करें

आप "xlsx" पैकेज को स्थापित करने के लिए R कंसोल में निम्न कमांड का उपयोग कर सकते हैं। यह कुछ अतिरिक्त पैकेजों को स्थापित करने के लिए कह सकता है, जिन पर यह पैकेज निर्भर है। अतिरिक्त पैकेज को स्थापित करने के लिए आवश्यक पैकेज नाम के साथ एक ही कमांड का पालन करें।

install.packages("xlsx")

सत्यापित करें और "xlsx" पैकेज लोड करें

"Xlsx" पैकेज को सत्यापित और लोड करने के लिए निम्न कमांड का उपयोग करें।

# Verify the package is installed.
any(grepl("xlsx",installed.packages()))

# Load the library into R workspace.
library("xlsx")

जब स्क्रिप्ट चलाई जाती है तो हमें निम्नलिखित आउटपुट मिलते हैं।

[1] TRUE
Loading required package: rJava
Loading required package: methods
Loading required package: xlsxjars

Xlsx फ़ाइल के रूप में इनपुट

Microsoft Excel खोलें। शीट 1 नामक कार्य पत्रक में निम्नलिखित डेटा को कॉपी और पेस्ट करें।

id	name      salary    start_date	dept
1	Rick	    623.3	  1/1/2012	   IT
2	Dan       515.2     9/23/2013    Operations
3	Michelle  611	     11/15/2014	IT
4	Ryan	    729	     5/11/2014	   HR
5	Gary	    43.25     3/27/2015  	Finance
6	Nina	    578       5/21/2013	   IT
7	Simon	    632.8	  7/30/2013	   Operations
8	Guru	    722.5	  6/17/2014	   Finance

साथ ही निम्न डेटा को किसी अन्य वर्कशीट में कॉपी और पेस्ट करें और इस वर्कशीट को "शहर" में नाम दें।

name	    city
Rick	    Seattle
Dan       Tampa
Michelle  Chicago
Ryan	    Seattle
Gary	    Houston
Nina	    Boston
Simon	    Mumbai
Guru	    Dallas

एक्सेल फ़ाइल को "input.xlsx" के रूप में सहेजें। आपको इसे R कार्यस्थान की वर्तमान कार्यशील निर्देशिका में सहेजना चाहिए।

एक्सेल फाइल पढ़ना

Input.xlsx का उपयोग करके पढ़ा जाता है read.xlsx()नीचे दिखाए अनुसार कार्य करें। परिणाम को R वातावरण में डेटा फ़्रेम के रूप में संग्रहीत किया जाता है।

# Read the first worksheet in the file input.xlsx.
data <- read.xlsx("input.xlsx", sheetIndex = 1)
print(data)

जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -

id,   name,     salary,   start_date,   dept
1      1    Rick      623.30    2012-01-01    IT
2      2    Dan       515.20    2013-09-23    Operations
3      3    Michelle  611.00    2014-11-15    IT
4      4    Ryan      729.00    2014-05-11    HR
5     NA    Gary      843.25    2015-03-27    Finance
6      6    Nina      578.00    2013-05-21    IT
7      7    Simon     632.80    2013-07-30    Operations
8      8    Guru      722.50    2014-06-17    Finance