ggplot2 - гистограммы и гистограммы
Гистограммы представляют категориальные данные в прямоугольной форме. Полосы могут быть нанесены вертикально и горизонтально. Высота или длина пропорциональны значениям, представленным на графиках. Оси x и y гистограмм указывают категорию, которая включена в определенный набор данных.
Гистограмма - это гистограмма, которая представляет необработанные данные с четкой картиной распределения указанного набора данных.
В этой главе мы сосредоточимся на создании гистограмм и гистограмм с помощью ggplot2.
Понимание набора данных MPG
Давайте разберемся с набором данных, который будет использоваться. Набор данных Mpg содержит подмножество данных об экономии топлива, которые EPA предоставляет по ссылке ниже -
http://fueleconomy.gov
Он состоит из моделей, которые выпускались каждый год с 1999 по 2008 год. Это использовалось как показатель популярности автомобиля.
Следующая команда выполняется, чтобы понять список атрибутов, необходимых для набора данных.
> library(ggplot2)
Прикрепляемый пакет - ggplot2.
Следующий объект замаскирован _by_ .GlobalEnv -
mpg
Предупреждающие сообщения
- пакет arules был собран под R версии 3.5.1
- пакет tuneR был собран под R версии 3.5.3
- пакет ggplot2 был собран под R версии 3.5.3
Создание графика количества столбцов
График счетчика столбцов можно создать с помощью приведенного ниже графика -
> # A bar count plot
> p <- ggplot(mpg, aes(x=factor(cyl)))+
+ geom_bar(stat="count")
> p
geom_bar () - это функция, которая используется для создания гистограмм. Он принимает атрибут статистической ценности, называемый счетчиком.
Гистограмма
График подсчета гистограммы может быть создан с помощью указанного ниже графика -
> # A historgram count plot
> ggplot(data=mpg, aes(x=hwy)) +
+ geom_histogram( col="red",
+ fill="green",
+ alpha = .2,
+ binwidth = 5)
geom_histogram () включает все необходимые атрибуты для создания гистограммы. Здесь он принимает атрибут hwy с соответствующим счетчиком. Цвет подбирается согласно требованиям.
Гистограмма с накоплением
Общие графики гистограмм и гистограммы могут быть созданы, как показано ниже -
> p <- ggplot(mpg, aes(class))
> p + geom_bar()
> p + geom_bar()
Этот график включает все категории, определенные в гистограммах с соответствующим классом. Этот график называется составным графиком.