R - wykresy pudełkowe

Wykresy pudełkowe są miarą tego, jak dobrze rozproszone są dane w zestawie danych. Dzieli zbiór danych na trzy kwartyle. Ten wykres przedstawia minimum, maksimum, medianę, pierwszy kwartyl i trzeci kwartyl w zbiorze danych. Jest to również przydatne do porównywania dystrybucji danych w zestawach danych poprzez rysowanie wykresów pudełkowych dla każdego z nich.

Wykresy pudełkowe są tworzone w języku R przy użyciu rozszerzenia boxplot() funkcjonować.

Składnia

Podstawowa składnia tworzenia wykresu pudełkowego w R to -

boxplot(x, data, notch, varwidth, names, main)

Poniżej znajduje się opis użytych parametrów -

  • x jest wektorem lub formułą.

  • data jest ramką danych.

  • notchjest wartością logiczną. Ustaw jako TRUE, aby narysować wycięcie.

  • varwidthjest wartością logiczną. Ustaw jako prawdziwe, aby narysować szerokość prostokąta proporcjonalną do wielkości próbki.

  • names to etykiety grupowe, które zostaną wydrukowane pod każdym wykresem pudełkowym.

  • main służy do nadania tytułu wykresowi.

Przykład

Używamy zbioru danych „mtcars” dostępnego w środowisku R do tworzenia podstawowego wykresu pudełkowego. Spójrzmy na kolumny „mpg” i „cyl” w mtcars.

input <- mtcars[,c('mpg','cyl')]
print(head(input))

Kiedy wykonujemy powyższy kod, otrzymujemy następujący wynik -

mpg  cyl
Mazda RX4         21.0   6
Mazda RX4 Wag     21.0   6
Datsun 710        22.8   4
Hornet 4 Drive    21.4   6
Hornet Sportabout 18.7   8
Valiant           18.1   6

Tworzenie wykresu pudełkowego

Poniższy skrypt utworzy wykres pudełkowy dla relacji między mpg (mile na galon) a cyl (liczbą cylindrów).

# Give the chart file a name.
png(file = "boxplot.png")

# Plot the chart.
boxplot(mpg ~ cyl, data = mtcars, xlab = "Number of Cylinders",
   ylab = "Miles Per Gallon", main = "Mileage Data")

# Save the file.
dev.off()

Kiedy wykonujemy powyższy kod, daje on następujący wynik -

Boxplot z wycięciem

Możemy narysować wykres pudełkowy z wycięciem, aby dowiedzieć się, jak pasują do siebie mediany różnych grup danych.

Poniższy skrypt utworzy wykres pudełkowy z wycięciem dla każdej grupy danych.

# Give the chart file a name.
png(file = "boxplot_with_notch.png")

# Plot the chart.
boxplot(mpg ~ cyl, data = mtcars, 
   xlab = "Number of Cylinders",
   ylab = "Miles Per Gallon", 
   main = "Mileage Data",
   notch = TRUE, 
   varwidth = TRUE, 
   col = c("green","yellow","purple"),
   names = c("High","Medium","Low")
)
# Save the file.
dev.off()

Kiedy wykonujemy powyższy kod, daje on następujący wynik -