R - ฐานข้อมูล

ข้อมูลเป็นระบบฐานข้อมูลเชิงสัมพันธ์จะถูกจัดเก็บในรูปแบบปกติ ดังนั้นในการคำนวณทางสถิติเราจำเป็นต้องมีการสืบค้น Sql ขั้นสูงและซับซ้อนมาก แต่ R สามารถเชื่อมต่อกับฐานข้อมูลเชิงสัมพันธ์ได้อย่างง่ายดายเช่น MySql, Oracle, Sql server และอื่น ๆ และดึงข้อมูลจากฐานข้อมูลเหล่านี้เป็นกรอบข้อมูล เมื่อข้อมูลพร้อมใช้งานในสภาพแวดล้อม R ข้อมูลนั้นจะกลายเป็นชุดข้อมูล R ปกติและสามารถจัดการหรือวิเคราะห์ได้โดยใช้แพ็คเกจและฟังก์ชันที่มีประสิทธิภาพทั้งหมด

ในบทช่วยสอนนี้เราจะใช้ MySql เป็นฐานข้อมูลอ้างอิงสำหรับเชื่อมต่อกับ R

แพ็คเกจ RMySQL

R มีแพ็คเกจในตัวชื่อ "RMySQL" ซึ่งให้การเชื่อมต่อแบบเนทีฟระหว่างกับฐานข้อมูล MySql คุณสามารถติดตั้งแพ็กเกจนี้ในสภาวะแวดล้อม R โดยใช้คำสั่งต่อไปนี้

install.packages("RMySQL")

การเชื่อมต่อ R กับ MySql

เมื่อติดตั้งแพ็คเกจแล้วเราจะสร้างวัตถุการเชื่อมต่อใน R เพื่อเชื่อมต่อกับฐานข้อมูล ใช้ชื่อผู้ใช้รหัสผ่านชื่อฐานข้อมูลและชื่อโฮสต์เป็นอินพุต

# Create a connection Object to MySQL database.
# We will connect to the sampel database named "sakila" that comes with MySql installation.
mysqlconnection = dbConnect(MySQL(), user = 'root', password = '', dbname = 'sakila',
   host = 'localhost')

# List the tables available in this database.
 dbListTables(mysqlconnection)

เมื่อเรารันโค้ดด้านบนจะให้ผลลัพธ์ดังนี้ -

[1] "actor"                      "actor_info"                
 [3] "address"                    "category"                  
 [5] "city"                       "country"                   
 [7] "customer"                   "customer_list"             
 [9] "film"                       "film_actor"                
[11] "film_category"              "film_list"                 
[13] "film_text"                  "inventory"                 
[15] "language"                   "nicer_but_slower_film_list"
[17] "payment"                    "rental"                    
[19] "sales_by_film_category"     "sales_by_store"            
[21] "staff"                      "staff_list"                
[23] "store"

การสืบค้นตาราง

เราสามารถสอบถามตารางฐานข้อมูลใน MySql โดยใช้ฟังก์ชัน dbSendQuery(). แบบสอบถามจะถูกดำเนินการใน MySql และชุดผลลัพธ์จะถูกส่งกลับโดยใช้ Rfetch()ฟังก์ชัน ในที่สุดก็จะถูกเก็บเป็นกรอบข้อมูลใน R

# Query the "actor" tables to get all the rows.
result = dbSendQuery(mysqlconnection, "select * from actor")

# Store the result in a R data frame object. n = 5 is used to fetch first 5 rows.
data.frame = fetch(result, n = 5)
print(data.fame)

เมื่อเรารันโค้ดด้านบนจะให้ผลลัพธ์ดังนี้ -

actor_id   first_name    last_name         last_update
1        1         PENELOPE      GUINESS           2006-02-15 04:34:33
2        2         NICK          WAHLBERG          2006-02-15 04:34:33
3        3         ED            CHASE             2006-02-15 04:34:33
4        4         JENNIFER      DAVIS             2006-02-15 04:34:33
5        5         JOHNNY        LOLLOBRIGIDA      2006-02-15 04:34:33

ค้นหาด้วย Filter Clause

เราสามารถส่งแบบสอบถามเลือกที่ถูกต้องเพื่อให้ได้ผลลัพธ์

result = dbSendQuery(mysqlconnection, "select * from actor where last_name = 'TORN'")

# Fetch all the records(with n = -1) and store it as a data frame.
data.frame = fetch(result, n = -1)
print(data)

เมื่อเรารันโค้ดด้านบนจะให้ผลลัพธ์ดังนี้ -

actor_id    first_name     last_name         last_update
1        18         DAN            TORN              2006-02-15 04:34:33
2        94         KENNETH        TORN              2006-02-15 04:34:33
3       102         WALTER         TORN              2006-02-15 04:34:33

การอัปเดตแถวในตาราง

เราสามารถอัปเดตแถวในตาราง Mysql ได้โดยส่งแบบสอบถามการอัปเดตไปยังฟังก์ชัน dbSendQuery ()

dbSendQuery(mysqlconnection, "update mtcars set disp = 168.5 where hp = 110")

หลังจากรันโค้ดด้านบนแล้วเราจะเห็นตารางที่อัปเดตใน MySql Environment

การแทรกข้อมูลลงในตาราง

dbSendQuery(mysqlconnection,
   "insert into mtcars(row_names, mpg, cyl, disp, hp, drat, wt, qsec, vs, am, gear, carb)
   values('New Mazda RX4 Wag', 21, 6, 168.5, 110, 3.9, 2.875, 17.02, 0, 1, 4, 4)"
)

หลังจากรันโค้ดด้านบนแล้วเราจะเห็นแถวที่แทรกลงในตารางใน MySql Environment

การสร้างตารางใน MySql

เราสามารถสร้างตารางใน MySql โดยใช้ฟังก์ชัน dbWriteTable(). จะเขียนทับตารางหากมีอยู่แล้วและใช้กรอบข้อมูลเป็นอินพุต

# Create the connection object to the database where we want to create the table.
mysqlconnection = dbConnect(MySQL(), user = 'root', password = '', dbname = 'sakila', 
   host = 'localhost')

# Use the R data frame "mtcars" to create the table in MySql.
# All the rows of mtcars are taken inot MySql.
dbWriteTable(mysqlconnection, "mtcars", mtcars[, ], overwrite = TRUE)

หลังจากรันโค้ดด้านบนเราจะเห็นตารางที่สร้างขึ้นใน MySql Environment

การวางตารางใน MySql

เราสามารถวางตารางในฐานข้อมูล MySql โดยส่งผ่านคำสั่ง drop table ไปยัง dbSendQuery () ในลักษณะเดียวกับที่เราใช้ในการสืบค้นข้อมูลจากตาราง

dbSendQuery(mysqlconnection, 'drop table if exists mtcars')

หลังจากดำเนินการตามโค้ดด้านบนเราจะเห็นว่าตารางถูกทิ้งใน MySql Environment