R - Archivo de Excel

Microsoft Excel es el programa de hoja de cálculo más utilizado que almacena datos en formato .xls o .xlsx. R puede leer directamente de estos archivos usando algunos paquetes específicos de Excel. Pocos de estos paquetes son: XLConnect, xlsx, gdata, etc. Usaremos el paquete xlsx. R también puede escribir en un archivo de Excel usando este paquete.

Instalar paquete xlsx

Puede utilizar el siguiente comando en la consola de R para instalar el paquete "xlsx". Es posible que solicite instalar algunos paquetes adicionales de los que este paquete depende. Siga el mismo comando con el nombre del paquete requerido para instalar los paquetes adicionales.

install.packages("xlsx")

Verificar y cargar el paquete "xlsx"

Utilice el siguiente comando para verificar y cargar el paquete "xlsx".

# Verify the package is installed.
any(grepl("xlsx",installed.packages()))

# Load the library into R workspace.
library("xlsx")

Cuando se ejecuta el script, obtenemos el siguiente resultado.

[1] TRUE
Loading required package: rJava
Loading required package: methods
Loading required package: xlsxjars

Entrada como archivo xlsx

Abra Microsoft Excel. Copie y pegue los siguientes datos en la hoja de trabajo denominada sheet1.

id	name      salary    start_date	dept
1	Rick	    623.3	  1/1/2012	   IT
2	Dan       515.2     9/23/2013    Operations
3	Michelle  611	     11/15/2014	IT
4	Ryan	    729	     5/11/2014	   HR
5	Gary	    43.25     3/27/2015  	Finance
6	Nina	    578       5/21/2013	   IT
7	Simon	    632.8	  7/30/2013	   Operations
8	Guru	    722.5	  6/17/2014	   Finance

También copie y pegue los siguientes datos en otra hoja de trabajo y cambie el nombre de esta hoja de trabajo a "ciudad".

name	    city
Rick	    Seattle
Dan       Tampa
Michelle  Chicago
Ryan	    Seattle
Gary	    Houston
Nina	    Boston
Simon	    Mumbai
Guru	    Dallas

Guarde el archivo de Excel como "input.xlsx". Debe guardarlo en el directorio de trabajo actual del espacio de trabajo de R.

Leer el archivo de Excel

El input.xlsx se lee usando el read.xlsx()funciona como se muestra a continuación. El resultado se almacena como un marco de datos en el entorno R.

# Read the first worksheet in the file input.xlsx.
data <- read.xlsx("input.xlsx", sheetIndex = 1)
print(data)

Cuando ejecutamos el código anterior, produce el siguiente resultado:

id,   name,     salary,   start_date,   dept
1      1    Rick      623.30    2012-01-01    IT
2      2    Dan       515.20    2013-09-23    Operations
3      3    Michelle  611.00    2014-11-15    IT
4      4    Ryan      729.00    2014-05-11    HR
5     NA    Gary      843.25    2015-03-27    Finance
6      6    Nina      578.00    2013-05-21    IT
7      7    Simon     632.80    2013-07-30    Operations
8      8    Guru      722.50    2014-06-17    Finance