R-데이터베이스

데이터는 관계형 데이터베이스 시스템이 정규화 된 형식으로 저장됩니다. 따라서 통계 컴퓨팅을 수행하려면 매우 고급적이고 복잡한 Sql 쿼리가 필요합니다. 그러나 R은 MySql, Oracle, Sql 서버 등과 같은 많은 관계형 데이터베이스에 쉽게 연결할 수 있으며 데이터 프레임으로 레코드를 가져올 수 있습니다. R 환경에서 데이터를 사용할 수있게되면 일반 R 데이터 세트가되고 모든 강력한 패키지와 기능을 사용하여 조작하거나 분석 할 수 있습니다.

이 자습서에서는 MySql을 R에 연결하기위한 참조 데이터베이스로 사용합니다.

RMySQL 패키지

R에는 MySql 데이터베이스와의 기본 연결을 제공하는 "RMySQL"이라는 기본 제공 패키지가 있습니다. 다음 명령을 사용하여 R 환경에서이 패키지를 설치할 수 있습니다.

install.packages("RMySQL")

R을 MySql에 연결

패키지가 설치되면 R에서 연결 개체를 만들어 데이터베이스에 연결합니다. 사용자 이름, 암호, 데이터베이스 이름 및 호스트 이름을 입력으로 사용합니다.

# Create a connection Object to MySQL database.
# We will connect to the sampel database named "sakila" that comes with MySql installation.
mysqlconnection = dbConnect(MySQL(), user = 'root', password = '', dbname = 'sakila',
   host = 'localhost')

# List the tables available in this database.
 dbListTables(mysqlconnection)

위 코드를 실행하면 다음과 같은 결과가 생성됩니다.

[1] "actor"                      "actor_info"                
 [3] "address"                    "category"                  
 [5] "city"                       "country"                   
 [7] "customer"                   "customer_list"             
 [9] "film"                       "film_actor"                
[11] "film_category"              "film_list"                 
[13] "film_text"                  "inventory"                 
[15] "language"                   "nicer_but_slower_film_list"
[17] "payment"                    "rental"                    
[19] "sales_by_film_category"     "sales_by_store"            
[21] "staff"                      "staff_list"                
[23] "store"

테이블 쿼리

함수를 사용하여 MySql의 데이터베이스 테이블을 쿼리 할 수 ​​있습니다. dbSendQuery(). 쿼리는 MySql에서 실행되고 결과 집합은 R을 사용하여 반환됩니다.fetch()함수. 마지막으로 R에 데이터 프레임으로 저장됩니다.

# Query the "actor" tables to get all the rows.
result = dbSendQuery(mysqlconnection, "select * from actor")

# Store the result in a R data frame object. n = 5 is used to fetch first 5 rows.
data.frame = fetch(result, n = 5)
print(data.fame)

위 코드를 실행하면 다음과 같은 결과가 생성됩니다.

actor_id   first_name    last_name         last_update
1        1         PENELOPE      GUINESS           2006-02-15 04:34:33
2        2         NICK          WAHLBERG          2006-02-15 04:34:33
3        3         ED            CHASE             2006-02-15 04:34:33
4        4         JENNIFER      DAVIS             2006-02-15 04:34:33
5        5         JOHNNY        LOLLOBRIGIDA      2006-02-15 04:34:33

필터 절을 사용한 쿼리

결과를 얻기 위해 유효한 선택 쿼리를 전달할 수 있습니다.

result = dbSendQuery(mysqlconnection, "select * from actor where last_name = 'TORN'")

# Fetch all the records(with n = -1) and store it as a data frame.
data.frame = fetch(result, n = -1)
print(data)

위 코드를 실행하면 다음과 같은 결과가 생성됩니다.

actor_id    first_name     last_name         last_update
1        18         DAN            TORN              2006-02-15 04:34:33
2        94         KENNETH        TORN              2006-02-15 04:34:33
3       102         WALTER         TORN              2006-02-15 04:34:33

테이블의 행 업데이트

업데이트 쿼리를 dbSendQuery () 함수에 전달하여 Mysql 테이블의 행을 업데이트 할 수 있습니다.

dbSendQuery(mysqlconnection, "update mtcars set disp = 168.5 where hp = 110")

위의 코드를 실행하면 MySql 환경에서 업데이트 된 테이블을 볼 수 있습니다.

테이블에 데이터 삽입

dbSendQuery(mysqlconnection,
   "insert into mtcars(row_names, mpg, cyl, disp, hp, drat, wt, qsec, vs, am, gear, carb)
   values('New Mazda RX4 Wag', 21, 6, 168.5, 110, 3.9, 2.875, 17.02, 0, 1, 4, 4)"
)

위 코드를 실행하면 MySql 환경의 테이블에 삽입 된 행을 볼 수 있습니다.

MySql에서 테이블 만들기

함수를 사용하여 MySql에 테이블을 만들 수 있습니다. dbWriteTable(). 이미 존재하는 경우 테이블을 덮어 쓰고 데이터 프레임을 입력으로 사용합니다.

# Create the connection object to the database where we want to create the table.
mysqlconnection = dbConnect(MySQL(), user = 'root', password = '', dbname = 'sakila', 
   host = 'localhost')

# Use the R data frame "mtcars" to create the table in MySql.
# All the rows of mtcars are taken inot MySql.
dbWriteTable(mysqlconnection, "mtcars", mtcars[, ], overwrite = TRUE)

위의 코드를 실행하면 MySql 환경에서 생성 된 테이블을 볼 수 있습니다.

MySql에서 테이블 삭제

테이블에서 데이터를 쿼리하는 데 사용한 것과 동일한 방식으로 테이블 삭제 문을 dbSendQuery ()로 전달하여 MySql 데이터베이스의 테이블을 삭제할 수 있습니다.

dbSendQuery(mysqlconnection, 'drop table if exists mtcars')

위의 코드를 실행하면 MySql 환경에서 테이블이 삭제되는 것을 볼 수 있습니다.