ggplot2 - Działki marginalne

W tym rozdziale omówimy wykresy krańcowe.

Zrozumienie wątków krańcowych

Wykresy krańcowe służą do oceny zależności między dwiema zmiennymi i zbadania ich rozkładów. Kiedy mówimy o tworzeniu wykresów marginalnych, są one niczym innym jak wykresami punktowymi, które mają histogramy, wykresy pudełkowe lub wykresy punktowe na marginesach odpowiednich osi x i y.

Poniższe kroki zostaną wykorzystane do stworzenia wykresu marginalnego za pomocą R przy użyciu pakietu „ggExtra”. Ten pakiet ma na celu ulepszenie funkcji pakietu „ggplot2” i zawiera różne funkcje do tworzenia udanych wykresów marginalnych.

Krok 1

Zainstaluj pakiet „ggExtra” za pomocą następującego polecenia, aby pomyślnie wykonać (jeśli pakiet nie jest zainstalowany w Twoim systemie).

> install.packages("ggExtra")

Krok 2

Uwzględnij wymagane biblioteki w obszarze roboczym, aby utworzyć wykresy marginalne.

> library(ggplot2)
> library(ggExtra)

Krok 3

Czytanie wymaganego zbioru danych „mpg”, którego używaliśmy w poprzednich rozdziałach.

> data(mpg)
> head(mpg)
# A tibble: 6 x 11
manufacturer   model  displ   year   cyl   trans      drv   cty   hwy  fl  class
<chr> <chr> <dbl> <int> <int> <chr> <chr> <int> <int> <chr> <chr>
1 audi         a4     1.8     1999   4     auto(l5)   f     18    29   p   compa~
2 audi         a4     1.8     1999   4     manual(m5) f     21    29   p   compa~
3 audi         a4     2       2008   4     manual(m6) f     20    31   p   compa~
4 audi         a4     2       2008   4     auto(av)   f     21    30   p   compa~
5 audi         a4     2.8     1999   6     auto(l5)   f     16    26   p   compa~
6 audi         a4     2.8     1999   6     manual(m5) f     18    26   p   compa~
>

Krok 4

Teraz stwórzmy prosty wykres za pomocą „ggplot2”, który pomoże nam zrozumieć koncepcję wykresów marginalnych.

> #Plot
> g <- ggplot(mpg, aes(cty, hwy)) +
+    geom_count() +
+    geom_smooth(method="lm", se=F)
> g

Związek między zmiennymi

Teraz stwórzmy wykresy krańcowe za pomocą funkcji ggMarginal, która pomaga wygenerować związek między dwoma atrybutami „hwy” i „cty”.

> ggMarginal(g, type = "histogram", fill="transparent")
> ggMarginal(g, type = "boxplot", fill="transparent")

Dane wyjściowe dla wykresów krańcowych histogramu są wymienione poniżej -

Dane wyjściowe dla wykresów brzeżnych skrzynkowych są wymienione poniżej -