ggplot2 - Nhiều lô

Trong chương này, chúng tôi sẽ tập trung vào việc tạo nhiều ô có thể được sử dụng thêm để tạo các ô 3 chiều. Danh sách các mảnh đất sẽ được bao gồm:

  • Lô mật độ
  • Ô hộp
  • Châm điểm
  • Lô đàn vĩ cầm

Chúng tôi sẽ sử dụng tập dữ liệu “mpg” như được sử dụng trong các chương trước. Bộ dữ liệu này cung cấp dữ liệu tiết kiệm nhiên liệu từ năm 1999 và 2008 cho 38 mẫu ô tô phổ biến. Tập dữ liệu được vận chuyển cùng với gói ggplot2. Điều quan trọng là làm theo các bước được đề cập dưới đây để tạo ra các loại lô khác nhau.

> # Load Modules
> library(ggplot2)
>
> # Dataset
> head(mpg)
# A tibble: 6 x 11
manufacturer  model   displ   year   cyl   trans       drv   cty   hwy  fl   class
<chr> <chr> <dbl> <int> <int> <chr> <chr> <int> <int> <chr> <chr>
1 audi        a4      1.8     1999   4     auto(l5)    f     18    29   p    compa~
2 audi        a4      1.8     1999   4     manual(m5)  f     21    29   p    compa~
3 audi        a4      2       2008   4     manual(m6)  f     20    31   p    compa~
4 audi        a4      2       2008   4     auto(av)    f     21    30   p    compa~
5 audi        a4      2.8     1999   6     auto(l5)    f     16    26   p    compa~
6 audi        a4      2.8     1999   6     manual(m5)  f     18    26   p    compa~

Lô mật độ

Biểu đồ mật độ là một biểu diễn đồ họa về sự phân bố của bất kỳ biến số nào trong tập dữ liệu được đề cập. Nó sử dụng ước tính mật độ nhân để hiển thị hàm mật độ xác suất của biến.

Gói “ggplot2” bao gồm một hàm có tên là geom_density () để tạo một biểu đồ mật độ.

Chúng ta sẽ thực hiện lệnh sau để tạo biểu đồ mật độ:

> p −- ggplot(mpg, aes(cty)) +
+  geom_density(aes(fill=factor(cyl)), alpha=0.8)
> p

Chúng ta có thể quan sát các mật độ khác nhau từ âm mưu được tạo bên dưới -

Chúng ta có thể tạo cốt truyện bằng cách đổi tên các trục x và y để duy trì độ rõ nét hơn với việc bao gồm tiêu đề và truyền thuyết với các kết hợp màu sắc khác nhau.

> p + labs(title="Density plot",
+    subtitle="City Mileage Grouped by Number of cylinders",
+    caption="Source: mpg",
+    x="City Mileage",
+    fill="# Cylinders")

Ô hộp

Biểu đồ hộp còn được gọi là biểu đồ hộp và biểu đồ râu ria đại diện cho bản tóm tắt năm số của dữ liệu. Tóm tắt năm số bao gồm các giá trị như tối thiểu, phần tư thứ nhất, trung vị, phần tư thứ ba và tối đa. Đường thẳng đứng đi qua phần giữa của ô hình hộp được coi là "đường trung bình".

Chúng ta có thể tạo biểu đồ hộp bằng lệnh sau:

> p <- ggplot(mpg, aes(class, cty)) +
+  geom_boxplot(varwidth=T, fill="blue")
> p + labs(title="A Box plot Example",
+    subtitle="Mileage by Class",
+    caption="MPG Dataset",
+    x="Class",
+    y="Mileage")
>p

Ở đây, chúng tôi đang tạo biểu đồ hộp đối với các thuộc tính của lớp và cty.

Châm điểm

Ô chấm tương tự như ô phân tán chỉ khác về kích thước. Trong phần này, chúng tôi sẽ thêm biểu đồ chấm vào ô hộp hiện có để có hình ảnh rõ nét hơn.

Biểu đồ hộp có thể được tạo bằng lệnh sau:

> p <- ggplot(mpg, aes(manufacturer, cty)) +
+    geom_boxplot() +
+    theme(axis.text.x = element_text(angle=65, vjust=0.6))
> p

Biểu đồ chấm được tạo như được đề cập bên dưới -

> p + geom_dotplot(binaxis='y',
+    stackdir='center',
+    dotsize = .5
+    )

Lô đàn vĩ cầm

Cốt truyện vĩ cầm cũng được tạo ra theo cách tương tự, chỉ thay đổi cấu trúc của vĩ cầm thay vì hộp. Đầu ra được đề cập rõ ràng bên dưới -

> p <- ggplot(mpg, aes(class, cty))
>
> p + geom_violin()