R - plik programu Excel

Microsoft Excel to najczęściej używany program do obsługi arkuszy kalkulacyjnych, który przechowuje dane w formacie .xls lub .xlsx. R może czytać bezpośrednio z tych plików przy użyciu niektórych pakietów specyficznych dla programu Excel. Niewiele jest takich pakietów - XLConnect, xlsx, gdata itp. Będziemy używać pakietu xlsx. R może również zapisywać w pliku Excel przy użyciu tego pakietu.

Zainstaluj pakiet xlsx

Aby zainstalować pakiet „xlsx”, możesz użyć następującego polecenia w konsoli R. Może poprosić o zainstalowanie dodatkowych pakietów, od których zależy ten pakiet. Wykonaj to samo polecenie z wymaganą nazwą pakietu, aby zainstalować dodatkowe pakiety.

install.packages("xlsx")

Sprawdź i załaduj pakiet „xlsx”

Użyj następującego polecenia, aby zweryfikować i załadować pakiet „xlsx”.

# Verify the package is installed.
any(grepl("xlsx",installed.packages()))

# Load the library into R workspace.
library("xlsx")

Po uruchomieniu skryptu otrzymujemy następujące dane wyjściowe.

[1] TRUE
Loading required package: rJava
Loading required package: methods
Loading required package: xlsxjars

Wprowadź jako plik xlsx

Otwórz program Microsoft Excel. Skopiuj i wklej następujące dane do arkusza roboczego o nazwie arkusz1.

id	name      salary    start_date	dept
1	Rick	    623.3	  1/1/2012	   IT
2	Dan       515.2     9/23/2013    Operations
3	Michelle  611	     11/15/2014	IT
4	Ryan	    729	     5/11/2014	   HR
5	Gary	    43.25     3/27/2015  	Finance
6	Nina	    578       5/21/2013	   IT
7	Simon	    632.8	  7/30/2013	   Operations
8	Guru	    722.5	  6/17/2014	   Finance

Skopiuj również i wklej następujące dane do innego arkusza i zmień nazwę tego arkusza na „miasto”.

name	    city
Rick	    Seattle
Dan       Tampa
Michelle  Chicago
Ryan	    Seattle
Gary	    Houston
Nina	    Boston
Simon	    Mumbai
Guru	    Dallas

Zapisz plik Excela jako „input.xlsx”. Należy go zapisać w bieżącym katalogu roboczym obszaru roboczego R.

Czytanie pliku Excel

Plik input.xlsx jest odczytywany przy użyciu rozszerzenia read.xlsx()działają, jak pokazano poniżej. Wynik jest przechowywany jako ramka danych w środowisku R.

# Read the first worksheet in the file input.xlsx.
data <- read.xlsx("input.xlsx", sheetIndex = 1)
print(data)

Kiedy wykonujemy powyższy kod, daje on następujący wynik -

id,   name,     salary,   start_date,   dept
1      1    Rick      623.30    2012-01-01    IT
2      2    Dan       515.20    2013-09-23    Operations
3      3    Michelle  611.00    2014-11-15    IT
4      4    Ryan      729.00    2014-05-11    HR
5     NA    Gary      843.25    2015-03-27    Finance
6      6    Nina      578.00    2013-05-21    IT
7      7    Simon     632.80    2013-07-30    Operations
8      8    Guru      722.50    2014-06-17    Finance