R - Fichier Excel

Microsoft Excel est le tableur le plus utilisé qui stocke les données au format .xls ou .xlsx. R peut lire directement à partir de ces fichiers à l'aide de certains packages spécifiques à Excel. Peu de tels packages sont - XLConnect, xlsx, gdata etc. Nous utiliserons le package xlsx. R peut également écrire dans un fichier Excel en utilisant ce package.

Installer le package xlsx

Vous pouvez utiliser la commande suivante dans la console R pour installer le package «xlsx». Il peut demander l'installation de certains packages supplémentaires dont ce package dépend. Suivez la même commande avec le nom de package requis pour installer les packages supplémentaires.

install.packages("xlsx")

Vérifier et charger le package «xlsx»

Utilisez la commande suivante pour vérifier et charger le package «xlsx».

# Verify the package is installed.
any(grepl("xlsx",installed.packages()))

# Load the library into R workspace.
library("xlsx")

Lorsque le script est exécuté, nous obtenons la sortie suivante.

[1] TRUE
Loading required package: rJava
Loading required package: methods
Loading required package: xlsxjars

Entrée en tant que fichier xlsx

Ouvrez Microsoft Excel. Copiez et collez les données suivantes dans la feuille de travail nommée feuille1.

id	name      salary    start_date	dept
1	Rick	    623.3	  1/1/2012	   IT
2	Dan       515.2     9/23/2013    Operations
3	Michelle  611	     11/15/2014	IT
4	Ryan	    729	     5/11/2014	   HR
5	Gary	    43.25     3/27/2015  	Finance
6	Nina	    578       5/21/2013	   IT
7	Simon	    632.8	  7/30/2013	   Operations
8	Guru	    722.5	  6/17/2014	   Finance

Copiez et collez également les données suivantes dans une autre feuille de calcul et renommez cette feuille de calcul en «ville».

name	    city
Rick	    Seattle
Dan       Tampa
Michelle  Chicago
Ryan	    Seattle
Gary	    Houston
Nina	    Boston
Simon	    Mumbai
Guru	    Dallas

Enregistrez le fichier Excel sous "input.xlsx". Vous devez l'enregistrer dans le répertoire de travail actuel de l'espace de travail R.

Lire le fichier Excel

Le fichier input.xlsx est lu en utilisant le read.xlsx()fonction comme indiqué ci-dessous. Le résultat est stocké sous forme de trame de données dans l'environnement R.

# Read the first worksheet in the file input.xlsx.
data <- read.xlsx("input.xlsx", sheetIndex = 1)
print(data)

Lorsque nous exécutons le code ci-dessus, cela produit le résultat suivant -

id,   name,     salary,   start_date,   dept
1      1    Rick      623.30    2012-01-01    IT
2      2    Dan       515.20    2013-09-23    Operations
3      3    Michelle  611.00    2014-11-15    IT
4      4    Ryan      729.00    2014-05-11    HR
5     NA    Gary      843.25    2015-03-27    Finance
6      6    Nina      578.00    2013-05-21    IT
7      7    Simon     632.80    2013-07-30    Operations
8      8    Guru      722.50    2014-06-17    Finance