ggplot2 - Wykresy słupkowe i histogramy
Wykresy słupkowe przedstawiają dane jakościowe w sposób prostokątny. Słupki można kreślić w pionie i poziomie. Wysokości lub długości są proporcjonalne do wartości przedstawionych na wykresach. Osie X i Y wykresów słupkowych określają kategorię, która jest zawarta w określonym zestawie danych.
Histogram to wykres słupkowy, który przedstawia surowe dane z wyraźnym obrazem rozkładu wspomnianego zestawu danych.
W tym rozdziale skupimy się na tworzeniu wykresów słupkowych i histogramów za pomocą ggplot2.
Zrozumienie zbioru danych MPG
Rozumiemy zbiór danych, który będzie używany. Zestaw danych mpg zawiera podzbiór danych dotyczących zużycia paliwa, które EPA udostępnia w poniższym linku -
http://fueleconomy.gov
Składa się z modeli, które były wydawane co roku w latach 1999-2008. Zostało to wykorzystane jako wskaźnik popularności samochodu.
Następujące polecenie jest wykonywane w celu zrozumienia listy atrybutów wymaganych dla zestawu danych.
> library(ggplot2)
Pakiet dołączający to ggplot2.
Następujący obiekt jest zamaskowany _by_ .GlobalEnv -
mpg
Komunikaty ostrzegawcze
- pakiet arules został zbudowany pod R w wersji 3.5.1
- pakiet tuneR został zbudowany pod R w wersji 3.5.3
- pakiet ggplot2 został zbudowany pod R w wersji 3.5.3
Tworzenie wykresu liczby słupków
Wykres liczby słupków można utworzyć za pomocą poniższego wykresu -
> # A bar count plot
> p <- ggplot(mpg, aes(x=factor(cyl)))+
+ geom_bar(stat="count")
> p
geom_bar () to funkcja używana do tworzenia wykresów słupkowych. Przyjmuje atrybut wartości statystycznej o nazwie count.
Histogram
Wykres liczby histogramów można utworzyć za pomocą poniższego wykresu -
> # A historgram count plot
> ggplot(data=mpg, aes(x=hwy)) +
+ geom_histogram( col="red",
+ fill="green",
+ alpha = .2,
+ binwidth = 5)
geom_histogram () zawiera wszystkie niezbędne atrybuty do tworzenia histogramu. Tutaj przyjmuje atrybut hwy z odpowiednią liczbą. Kolor jest pobierany zgodnie z wymaganiami.
Skumulowany wykres słupkowy
Ogólne wykresy wykresów słupkowych i histogramu można utworzyć jak poniżej -
> p <- ggplot(mpg, aes(class))
> p + geom_bar()
> p + geom_bar()
Ten wykres obejmuje wszystkie kategorie zdefiniowane na wykresach słupkowych z odpowiednią klasą. Ten wykres nazywa się wykresem skumulowanym.