ggplot2 - Lô biên
Trong chương này, chúng ta sẽ thảo luận về các Lô biên.
Hiểu các lô biên
Đồ thị biên được sử dụng để đánh giá mối quan hệ giữa hai biến và kiểm tra sự phân bố của chúng. Khi chúng ta nói về việc tạo các biểu đồ biên, chúng không là gì khác ngoài các biểu đồ phân tán có biểu đồ, biểu đồ hộp hoặc biểu đồ chấm ở biên của các trục x và y tương ứng.
Các bước sau sẽ được sử dụng để tạo biểu đồ biên với R bằng gói “ggExtra”. Gói này được thiết kế để nâng cao các tính năng của gói “ggplot2” và bao gồm các chức năng khác nhau để tạo các lô biên thành công.
Bước 1
Cài đặt gói “ggExtra” bằng lệnh sau để thực thi thành công (nếu gói chưa được cài đặt trong hệ thống của bạn).
> install.packages("ggExtra")
Bước 2
Bao gồm các thư viện bắt buộc trong không gian làm việc để tạo các ô biên.
> library(ggplot2)
> library(ggExtra)
Bước 3
Đọc tập dữ liệu bắt buộc “mpg” mà chúng tôi đã sử dụng trong các chương trước.
> data(mpg)
> head(mpg)
# A tibble: 6 x 11
manufacturer model displ year cyl trans drv cty hwy fl class
<chr> <chr> <dbl> <int> <int> <chr> <chr> <int> <int> <chr> <chr>
1 audi a4 1.8 1999 4 auto(l5) f 18 29 p compa~
2 audi a4 1.8 1999 4 manual(m5) f 21 29 p compa~
3 audi a4 2 2008 4 manual(m6) f 20 31 p compa~
4 audi a4 2 2008 4 auto(av) f 21 30 p compa~
5 audi a4 2.8 1999 6 auto(l5) f 16 26 p compa~
6 audi a4 2.8 1999 6 manual(m5) f 18 26 p compa~
>
Bước 4
Bây giờ chúng ta hãy tạo một biểu đồ đơn giản bằng cách sử dụng “ggplot2” sẽ giúp chúng ta hiểu khái niệm về các biểu đồ cận biên.
> #Plot
> g <- ggplot(mpg, aes(cty, hwy)) +
+ geom_count() +
+ geom_smooth(method="lm", se=F)
> g
Mối quan hệ giữa các biến
Bây giờ chúng ta hãy tạo các đồ thị biên bằng cách sử dụng hàm ggMarginal để tạo ra mối quan hệ giữa hai thuộc tính “hwy” và “cty”.
> ggMarginal(g, type = "histogram", fill="transparent")
> ggMarginal(g, type = "boxplot", fill="transparent")
Đầu ra cho các đồ thị biên biểu đồ được đề cập dưới đây:
Đầu ra cho các ô biên dạng hộp được đề cập dưới đây: