R - Arquivo Excel

O Microsoft Excel é o programa de planilhas mais amplamente usado que armazena dados no formato .xls ou .xlsx. R pode ler diretamente desses arquivos usando alguns pacotes específicos do Excel. Poucos pacotes são - XLConnect, xlsx, gdata etc. Estaremos usando o pacote xlsx. R também pode escrever em arquivo excel usando este pacote.

Instale o pacote xlsx

Você pode usar o seguinte comando no console R para instalar o pacote "xlsx". Pode ser necessário instalar alguns pacotes adicionais dos quais este pacote depende. Siga o mesmo comando com o nome do pacote necessário para instalar os pacotes adicionais.

install.packages("xlsx")

Verifique e carregue o pacote "xlsx"

Use o seguinte comando para verificar e carregar o pacote "xlsx".

# Verify the package is installed.
any(grepl("xlsx",installed.packages()))

# Load the library into R workspace.
library("xlsx")

Quando o script é executado, obtemos a seguinte saída.

[1] TRUE
Loading required package: rJava
Loading required package: methods
Loading required package: xlsxjars

Entrada como arquivo xlsx

Abra o Microsoft Excel. Copie e cole os seguintes dados na planilha chamada planilha1.

id	name      salary    start_date	dept
1	Rick	    623.3	  1/1/2012	   IT
2	Dan       515.2     9/23/2013    Operations
3	Michelle  611	     11/15/2014	IT
4	Ryan	    729	     5/11/2014	   HR
5	Gary	    43.25     3/27/2015  	Finance
6	Nina	    578       5/21/2013	   IT
7	Simon	    632.8	  7/30/2013	   Operations
8	Guru	    722.5	  6/17/2014	   Finance

Além disso, copie e cole os seguintes dados em outra planilha e renomeie esta planilha para "cidade".

name	    city
Rick	    Seattle
Dan       Tampa
Michelle  Chicago
Ryan	    Seattle
Gary	    Houston
Nina	    Boston
Simon	    Mumbai
Guru	    Dallas

Salve o arquivo Excel como "input.xlsx". Você deve salvá-lo no diretório de trabalho atual da área de trabalho R.

Lendo o arquivo Excel

O input.xlsx é lido usando o read.xlsx()função conforme mostrado abaixo. O resultado é armazenado como um quadro de dados no ambiente R.

# Read the first worksheet in the file input.xlsx.
data <- read.xlsx("input.xlsx", sheetIndex = 1)
print(data)

Quando executamos o código acima, ele produz o seguinte resultado -

id,   name,     salary,   start_date,   dept
1      1    Rick      623.30    2012-01-01    IT
2      2    Dan       515.20    2013-09-23    Operations
3      3    Michelle  611.00    2014-11-15    IT
4      4    Ryan      729.00    2014-05-11    HR
5     NA    Gary      843.25    2015-03-27    Finance
6      6    Nina      578.00    2013-05-21    IT
7      7    Simon     632.80    2013-07-30    Operations
8      8    Guru      722.50    2014-06-17    Finance