ggplot2 - wiele wykresów

W tym rozdziale skupimy się na tworzeniu wielu działek, które można później wykorzystać do tworzenia wykresów trójwymiarowych. Lista działek, które zostaną pokryte obejmuje:

  • Wykres gęstości
  • Wykres pudełkowy
  • Wykres punktowy
  • Fabuła skrzypiec

Użyjemy zestawu danych „mpg”, tak jak w poprzednich rozdziałach. Ten zestaw danych zawiera dane dotyczące zużycia paliwa z lat 1999 i 2008 dla 38 popularnych modeli samochodów. Zestaw danych jest dostarczany z pakietem ggplot2. Ważne jest, aby wykonać poniższy krok, aby utworzyć różne typy działek.

> # Load Modules
> library(ggplot2)
>
> # Dataset
> head(mpg)
# A tibble: 6 x 11
manufacturer  model   displ   year   cyl   trans       drv   cty   hwy  fl   class
<chr> <chr> <dbl> <int> <int> <chr> <chr> <int> <int> <chr> <chr>
1 audi        a4      1.8     1999   4     auto(l5)    f     18    29   p    compa~
2 audi        a4      1.8     1999   4     manual(m5)  f     21    29   p    compa~
3 audi        a4      2       2008   4     manual(m6)  f     20    31   p    compa~
4 audi        a4      2       2008   4     auto(av)    f     21    30   p    compa~
5 audi        a4      2.8     1999   6     auto(l5)    f     16    26   p    compa~
6 audi        a4      2.8     1999   6     manual(m5)  f     18    26   p    compa~

Wykres gęstości

Wykres gęstości jest graficzną reprezentacją rozkładu dowolnej zmiennej numerycznej we wspomnianym zbiorze danych. Wykorzystuje oszacowanie gęstości jądra, aby pokazać funkcję gęstości prawdopodobieństwa zmiennej.

Pakiet „ggplot2” zawiera funkcję o nazwie geom_density () do tworzenia wykresu gęstości.

Wykonamy następujące polecenie, aby utworzyć wykres gęstości -

> p −- ggplot(mpg, aes(cty)) +
+  geom_density(aes(fill=factor(cyl)), alpha=0.8)
> p

Na utworzonej poniżej działce możemy zaobserwować różne zagęszczenia -

Możemy stworzyć fabułę, zmieniając nazwy osi X i Y, co zapewnia lepszą przejrzystość dzięki włączeniu tytułu i legend z różnymi kombinacjami kolorów.

> p + labs(title="Density plot",
+    subtitle="City Mileage Grouped by Number of cylinders",
+    caption="Source: mpg",
+    x="City Mileage",
+    fill="# Cylinders")

Wykres pudełkowy

Wykres pudełkowy, nazywany również wykresem pudełkowym i wąsowym, reprezentuje pięciocyfrowe podsumowanie danych. Pięć podsumowań liczb obejmuje wartości takie jak minimum, pierwszy kwartyl, mediana, trzeci kwartyl i maksimum. Pionowa linia przechodząca przez środkową część wykresu pudełkowego jest uważana za „medianę”.

Możemy utworzyć wykres pudełkowy za pomocą następującego polecenia -

> p <- ggplot(mpg, aes(class, cty)) +
+  geom_boxplot(varwidth=T, fill="blue")
> p + labs(title="A Box plot Example",
+    subtitle="Mileage by Class",
+    caption="MPG Dataset",
+    x="Class",
+    y="Mileage")
>p

Tutaj tworzymy wykres pudełkowy z uwzględnieniem atrybutów klasy i cty.

Wykres punktowy

Wykresy punktowe są podobne do wykresów rozproszonych z tylko różnicą wymiarów. W tej sekcji dodamy wykres kropkowy do istniejącego wykresu pudełkowego, aby uzyskać lepszy obraz i przejrzystość.

Wykres pudełkowy można utworzyć za pomocą następującego polecenia -

> p <- ggplot(mpg, aes(manufacturer, cty)) +
+    geom_boxplot() +
+    theme(axis.text.x = element_text(angle=65, vjust=0.6))
> p

Wykres kropkowy jest tworzony jak wspomniano poniżej -

> p + geom_dotplot(binaxis='y',
+    stackdir='center',
+    dotsize = .5
+    )

Fabuła skrzypiec

Fabuła skrzypiec jest również tworzona w podobny sposób z jedyną zmianą struktury skrzypiec zamiast pudełka. Wynik jest wyraźnie wymieniony poniżej -

> p <- ggplot(mpg, aes(class, cty))
>
> p + geom_violin()