R - Excel-Datei

Microsoft Excel ist das am häufigsten verwendete Tabellenkalkulationsprogramm, das Daten im XLS- oder XLSX-Format speichert. R kann mit einigen Excel-spezifischen Paketen direkt aus diesen Dateien lesen. Nur wenige solcher Pakete sind - XLConnect, xlsx, gdata usw. Wir werden das xlsx-Paket verwenden. R kann mit diesem Paket auch in eine Excel-Datei schreiben.

Installieren Sie das xlsx-Paket

Sie können den folgenden Befehl in der R-Konsole verwenden, um das Paket "xlsx" zu installieren. Möglicherweise werden Sie aufgefordert, einige zusätzliche Pakete zu installieren, von denen dieses Paket abhängig ist. Befolgen Sie denselben Befehl mit dem erforderlichen Paketnamen, um die zusätzlichen Pakete zu installieren.

install.packages("xlsx")

Überprüfen und laden Sie das "xlsx" -Paket

Verwenden Sie den folgenden Befehl, um das Paket "xlsx" zu überprüfen und zu laden.

# Verify the package is installed.
any(grepl("xlsx",installed.packages()))

# Load the library into R workspace.
library("xlsx")

Wenn das Skript ausgeführt wird, erhalten wir die folgende Ausgabe.

[1] TRUE
Loading required package: rJava
Loading required package: methods
Loading required package: xlsxjars

Eingabe als xlsx-Datei

Öffnen Sie Microsoft Excel. Kopieren Sie die folgenden Daten und fügen Sie sie in das Arbeitsblatt mit dem Namen sheet1 ein.

id	name      salary    start_date	dept
1	Rick	    623.3	  1/1/2012	   IT
2	Dan       515.2     9/23/2013    Operations
3	Michelle  611	     11/15/2014	IT
4	Ryan	    729	     5/11/2014	   HR
5	Gary	    43.25     3/27/2015  	Finance
6	Nina	    578       5/21/2013	   IT
7	Simon	    632.8	  7/30/2013	   Operations
8	Guru	    722.5	  6/17/2014	   Finance

Kopieren Sie außerdem die folgenden Daten, fügen Sie sie in ein anderes Arbeitsblatt ein und benennen Sie dieses Arbeitsblatt in "Stadt" um.

name	    city
Rick	    Seattle
Dan       Tampa
Michelle  Chicago
Ryan	    Seattle
Gary	    Houston
Nina	    Boston
Simon	    Mumbai
Guru	    Dallas

Speichern Sie die Excel-Datei als "input.xlsx". Sie sollten es im aktuellen Arbeitsverzeichnis des R-Arbeitsbereichs speichern.

Lesen der Excel-Datei

Die input.xlsx wird mit dem gelesen read.xlsx()Funktion wie unten gezeigt. Das Ergebnis wird als Datenrahmen in der R-Umgebung gespeichert.

# Read the first worksheet in the file input.xlsx.
data <- read.xlsx("input.xlsx", sheetIndex = 1)
print(data)

Wenn wir den obigen Code ausführen, wird das folgende Ergebnis erzeugt:

id,   name,     salary,   start_date,   dept
1      1    Rick      623.30    2012-01-01    IT
2      2    Dan       515.20    2013-09-23    Operations
3      3    Michelle  611.00    2014-11-15    IT
4      4    Ryan      729.00    2014-05-11    HR
5     NA    Gary      843.25    2015-03-27    Finance
6      6    Nina      578.00    2013-05-21    IT
7      7    Simon     632.80    2013-07-30    Operations
8      8    Guru      722.50    2014-06-17    Finance