R - File Excel

Microsoft Excel è il programma di fogli di calcolo più utilizzato che memorizza i dati nel formato .xls o .xlsx. R può leggere direttamente da questi file utilizzando alcuni pacchetti specifici di Excel. Alcuni di questi pacchetti sono: XLConnect, xlsx, gdata ecc. Useremo il pacchetto xlsx. R può anche scrivere in un file excel usando questo pacchetto.

Installa il pacchetto xlsx

È possibile utilizzare il seguente comando nella console R per installare il pacchetto "xlsx". Potrebbe richiedere l'installazione di alcuni pacchetti aggiuntivi da cui dipende questo pacchetto. Seguire lo stesso comando con il nome del pacchetto richiesto per installare i pacchetti aggiuntivi.

install.packages("xlsx")

Verifica e carica il pacchetto "xlsx"

Utilizzare il seguente comando per verificare e caricare il pacchetto "xlsx".

# Verify the package is installed.
any(grepl("xlsx",installed.packages()))

# Load the library into R workspace.
library("xlsx")

Quando lo script viene eseguito, otteniamo il seguente output.

[1] TRUE
Loading required package: rJava
Loading required package: methods
Loading required package: xlsxjars

Immettere come file xlsx

Apri Microsoft Excel. Copia e incolla i seguenti dati nel foglio di lavoro denominato foglio1.

id	name      salary    start_date	dept
1	Rick	    623.3	  1/1/2012	   IT
2	Dan       515.2     9/23/2013    Operations
3	Michelle  611	     11/15/2014	IT
4	Ryan	    729	     5/11/2014	   HR
5	Gary	    43.25     3/27/2015  	Finance
6	Nina	    578       5/21/2013	   IT
7	Simon	    632.8	  7/30/2013	   Operations
8	Guru	    722.5	  6/17/2014	   Finance

Copia e incolla anche i seguenti dati in un altro foglio di lavoro e rinomina questo foglio di lavoro in "città".

name	    city
Rick	    Seattle
Dan       Tampa
Michelle  Chicago
Ryan	    Seattle
Gary	    Houston
Nina	    Boston
Simon	    Mumbai
Guru	    Dallas

Salva il file Excel come "input.xlsx". Dovresti salvarlo nella directory di lavoro corrente dello spazio di lavoro R.

Leggere il file Excel

Il file input.xlsx viene letto utilizzando il read.xlsx()funzionare come mostrato di seguito. Il risultato viene memorizzato come frame di dati nell'ambiente R.

# Read the first worksheet in the file input.xlsx.
data <- read.xlsx("input.xlsx", sheetIndex = 1)
print(data)

Quando eseguiamo il codice sopra, produce il seguente risultato:

id,   name,     salary,   start_date,   dept
1      1    Rick      623.30    2012-01-01    IT
2      2    Dan       515.20    2013-09-23    Operations
3      3    Michelle  611.00    2014-11-15    IT
4      4    Ryan      729.00    2014-05-11    HR
5     NA    Gary      843.25    2015-03-27    Finance
6      6    Nina      578.00    2013-05-21    IT
7      7    Simon     632.80    2013-07-30    Operations
8      8    Guru      722.50    2014-06-17    Finance