ggplot2 - Wykresy słupkowe i histogramy

Wykresy słupkowe przedstawiają dane jakościowe w sposób prostokątny. Słupki można kreślić w pionie i poziomie. Wysokości lub długości są proporcjonalne do wartości przedstawionych na wykresach. Osie X i Y wykresów słupkowych określają kategorię, która jest zawarta w określonym zestawie danych.

Histogram to wykres słupkowy, który przedstawia surowe dane z wyraźnym obrazem rozkładu wspomnianego zestawu danych.

W tym rozdziale skupimy się na tworzeniu wykresów słupkowych i histogramów za pomocą ggplot2.

Zrozumienie zbioru danych MPG

Rozumiemy zbiór danych, który będzie używany. Zestaw danych mpg zawiera podzbiór danych dotyczących zużycia paliwa, które EPA udostępnia w poniższym linku -

http://fueleconomy.gov

Składa się z modeli, które były wydawane co roku w latach 1999-2008. Zostało to wykorzystane jako wskaźnik popularności samochodu.

Następujące polecenie jest wykonywane w celu zrozumienia listy atrybutów wymaganych dla zestawu danych.

> library(ggplot2)

Pakiet dołączający to ggplot2.

Następujący obiekt jest zamaskowany _by_ .GlobalEnv -

mpg

Komunikaty ostrzegawcze

  • pakiet arules został zbudowany pod R w wersji 3.5.1
  • pakiet tuneR został zbudowany pod R w wersji 3.5.3
  • pakiet ggplot2 został zbudowany pod R w wersji 3.5.3

Tworzenie wykresu liczby słupków

Wykres liczby słupków można utworzyć za pomocą poniższego wykresu -

> # A bar count plot
> p <- ggplot(mpg, aes(x=factor(cyl)))+
+    geom_bar(stat="count")
> p

geom_bar () to funkcja używana do tworzenia wykresów słupkowych. Przyjmuje atrybut wartości statystycznej o nazwie count.

Histogram

Wykres liczby histogramów można utworzyć za pomocą poniższego wykresu -

> # A historgram count plot
> ggplot(data=mpg, aes(x=hwy)) +
+    geom_histogram( col="red",
+       fill="green",
+       alpha = .2,
+       binwidth = 5)

geom_histogram () zawiera wszystkie niezbędne atrybuty do tworzenia histogramu. Tutaj przyjmuje atrybut hwy z odpowiednią liczbą. Kolor jest pobierany zgodnie z wymaganiami.

Skumulowany wykres słupkowy

Ogólne wykresy wykresów słupkowych i histogramu można utworzyć jak poniżej -

> p <- ggplot(mpg, aes(class))
> p + geom_bar()
> p + geom_bar()

Ten wykres obejmuje wszystkie kategorie zdefiniowane na wykresach słupkowych z odpowiednią klasą. Ten wykres nazywa się wykresem skumulowanym.