ggplot2 - Diagrammes à barres et histogrammes
Les graphiques à barres représentent les données catégorielles de manière rectangulaire. Les barres peuvent être tracées verticalement et horizontalement. Les hauteurs ou longueurs sont proportionnelles aux valeurs représentées dans les graphiques. Les axes x et y des graphiques à barres spécifient la catégorie qui est incluse dans un jeu de données spécifique.
L'histogramme est un graphique à barres qui représente les données brutes avec une image claire de la distribution de l'ensemble de données mentionné.
Dans ce chapitre, nous nous concentrerons sur la création de graphiques à barres et d'histogrammes à l'aide de ggplot2.
Comprendre l'ensemble de données MPG
Comprenons l'ensemble de données qui sera utilisé. L'ensemble de données MPG contient un sous-ensemble des données d'économie de carburant que l'EPA met à disposition dans le lien ci-dessous -
http://fueleconomy.gov
Il se compose de modèles qui ont eu une nouvelle version chaque année entre 1999 et 2008. Cela a été utilisé comme indicateur de la popularité de la voiture.
La commande suivante est exécutée pour comprendre la liste des attributs nécessaires pour l'ensemble de données.
> library(ggplot2)
Le package joint est ggplot2.
L'objet suivant est masqué _par_ .GlobalEnv -
mpg
Messages d'avertissement
- le paquet arules a été construit sous la version R 3.5.1
- le package tuneR a été construit sous la version R 3.5.3
- le paquet ggplot2 a été construit sous la version R 3.5.3
Création d'un tracé de comptage de barres
Le tracé du nombre de barres peut être créé avec le tracé mentionné ci-dessous -
> # A bar count plot
> p <- ggplot(mpg, aes(x=factor(cyl)))+
+ geom_bar(stat="count")
> p
geom_bar () est la fonction utilisée pour créer des graphiques à barres. Il prend l'attribut de valeur statistique appelé count.
Histogramme
Le tracé de comptage d'histogramme peut être créé avec le tracé mentionné ci-dessous -
> # A historgram count plot
> ggplot(data=mpg, aes(x=hwy)) +
+ geom_histogram( col="red",
+ fill="green",
+ alpha = .2,
+ binwidth = 5)
geom_histogram () inclut tous les attributs nécessaires pour créer un histogramme. Ici, il prend l'attribut de hwy avec le nombre respectif. La couleur est prise selon les exigences.
Graphique à barres empilées
Les graphiques généraux des graphiques à barres et de l'histogramme peuvent être créés comme ci-dessous -
> p <- ggplot(mpg, aes(class))
> p + geom_bar()
> p + geom_bar()
Ce graphique comprend toutes les catégories définies dans les graphiques à barres avec la classe respective. Ce tracé est appelé graphique empilé.