ggplot2 - wiele wykresów
W tym rozdziale skupimy się na tworzeniu wielu działek, które można później wykorzystać do tworzenia wykresów trójwymiarowych. Lista działek, które zostaną pokryte obejmuje:
- Wykres gęstości
- Wykres pudełkowy
- Wykres punktowy
- Fabuła skrzypiec
Użyjemy zestawu danych „mpg”, tak jak w poprzednich rozdziałach. Ten zestaw danych zawiera dane dotyczące zużycia paliwa z lat 1999 i 2008 dla 38 popularnych modeli samochodów. Zestaw danych jest dostarczany z pakietem ggplot2. Ważne jest, aby wykonać poniższy krok, aby utworzyć różne typy działek.
> # Load Modules
> library(ggplot2)
>
> # Dataset
> head(mpg)
# A tibble: 6 x 11
manufacturer model displ year cyl trans drv cty hwy fl class
<chr> <chr> <dbl> <int> <int> <chr> <chr> <int> <int> <chr> <chr>
1 audi a4 1.8 1999 4 auto(l5) f 18 29 p compa~
2 audi a4 1.8 1999 4 manual(m5) f 21 29 p compa~
3 audi a4 2 2008 4 manual(m6) f 20 31 p compa~
4 audi a4 2 2008 4 auto(av) f 21 30 p compa~
5 audi a4 2.8 1999 6 auto(l5) f 16 26 p compa~
6 audi a4 2.8 1999 6 manual(m5) f 18 26 p compa~
Wykres gęstości
Wykres gęstości jest graficzną reprezentacją rozkładu dowolnej zmiennej numerycznej we wspomnianym zbiorze danych. Wykorzystuje oszacowanie gęstości jądra, aby pokazać funkcję gęstości prawdopodobieństwa zmiennej.
Pakiet „ggplot2” zawiera funkcję o nazwie geom_density () do tworzenia wykresu gęstości.
Wykonamy następujące polecenie, aby utworzyć wykres gęstości -
> p −- ggplot(mpg, aes(cty)) +
+ geom_density(aes(fill=factor(cyl)), alpha=0.8)
> p
Na utworzonej poniżej działce możemy zaobserwować różne zagęszczenia -
Możemy stworzyć fabułę, zmieniając nazwy osi X i Y, co zapewnia lepszą przejrzystość dzięki włączeniu tytułu i legend z różnymi kombinacjami kolorów.
> p + labs(title="Density plot",
+ subtitle="City Mileage Grouped by Number of cylinders",
+ caption="Source: mpg",
+ x="City Mileage",
+ fill="# Cylinders")
Wykres pudełkowy
Wykres pudełkowy, nazywany również wykresem pudełkowym i wąsowym, reprezentuje pięciocyfrowe podsumowanie danych. Pięć podsumowań liczb obejmuje wartości takie jak minimum, pierwszy kwartyl, mediana, trzeci kwartyl i maksimum. Pionowa linia przechodząca przez środkową część wykresu pudełkowego jest uważana za „medianę”.
Możemy utworzyć wykres pudełkowy za pomocą następującego polecenia -
> p <- ggplot(mpg, aes(class, cty)) +
+ geom_boxplot(varwidth=T, fill="blue")
> p + labs(title="A Box plot Example",
+ subtitle="Mileage by Class",
+ caption="MPG Dataset",
+ x="Class",
+ y="Mileage")
>p
Tutaj tworzymy wykres pudełkowy z uwzględnieniem atrybutów klasy i cty.
Wykres punktowy
Wykresy punktowe są podobne do wykresów rozproszonych z tylko różnicą wymiarów. W tej sekcji dodamy wykres kropkowy do istniejącego wykresu pudełkowego, aby uzyskać lepszy obraz i przejrzystość.
Wykres pudełkowy można utworzyć za pomocą następującego polecenia -
> p <- ggplot(mpg, aes(manufacturer, cty)) +
+ geom_boxplot() +
+ theme(axis.text.x = element_text(angle=65, vjust=0.6))
> p
Wykres kropkowy jest tworzony jak wspomniano poniżej -
> p + geom_dotplot(binaxis='y',
+ stackdir='center',
+ dotsize = .5
+ )
Fabuła skrzypiec
Fabuła skrzypiec jest również tworzona w podobny sposób z jedyną zmianą struktury skrzypiec zamiast pudełka. Wynik jest wyraźnie wymieniony poniżej -
> p <- ggplot(mpg, aes(class, cty))
>
> p + geom_violin()