ggplot2 - Plusieurs tracés

Dans ce chapitre, nous nous concentrerons sur la création de plusieurs tracés qui peuvent être utilisés ultérieurement pour créer des tracés en 3 dimensions. La liste des parcelles qui seront couvertes comprend -

  • Diagramme de densité
  • Boîte à moustaches
  • Tracé de points
  • Parcelle de violon

Nous utiliserons le jeu de données «mpg» tel qu'utilisé dans les chapitres précédents. Cet ensemble de données fournit des données sur la consommation de carburant de 1999 et 2008 pour 38 modèles de voitures populaires. L'ensemble de données est livré avec le package ggplot2. Il est important de suivre l'étape mentionnée ci-dessous pour créer différents types de parcelles.

> # Load Modules
> library(ggplot2)
>
> # Dataset
> head(mpg)
# A tibble: 6 x 11
manufacturer  model   displ   year   cyl   trans       drv   cty   hwy  fl   class
<chr> <chr> <dbl> <int> <int> <chr> <chr> <int> <int> <chr> <chr>
1 audi        a4      1.8     1999   4     auto(l5)    f     18    29   p    compa~
2 audi        a4      1.8     1999   4     manual(m5)  f     21    29   p    compa~
3 audi        a4      2       2008   4     manual(m6)  f     20    31   p    compa~
4 audi        a4      2       2008   4     auto(av)    f     21    30   p    compa~
5 audi        a4      2.8     1999   6     auto(l5)    f     16    26   p    compa~
6 audi        a4      2.8     1999   6     manual(m5)  f     18    26   p    compa~

Diagramme de densité

Un graphique de densité est une représentation graphique de la distribution de toute variable numérique dans l'ensemble de données mentionné. Il utilise une estimation de densité de noyau pour montrer la fonction de densité de probabilité de la variable.

Le package «ggplot2» comprend une fonction appelée geom_density () pour créer un graphique de densité.

Nous allons exécuter la commande suivante pour créer un graphique de densité -

> p −- ggplot(mpg, aes(cty)) +
+  geom_density(aes(fill=factor(cyl)), alpha=0.8)
> p

Nous pouvons observer différentes densités à partir du graphique créé ci-dessous -

Nous pouvons créer le tracé en renommant les axes x et y, ce qui maintient une meilleure clarté avec l'inclusion du titre et des légendes avec différentes combinaisons de couleurs.

> p + labs(title="Density plot",
+    subtitle="City Mileage Grouped by Number of cylinders",
+    caption="Source: mpg",
+    x="City Mileage",
+    fill="# Cylinders")

Boîte à moustaches

La boîte à moustaches, également appelée boîte à moustaches et moustache, représente le résumé à cinq chiffres des données. Les cinq résumés de nombres incluent des valeurs telles que minimum, premier quartile, médiane, troisième quartile et maximum. La ligne verticale qui traverse la partie médiane de la boîte à moustaches est considérée comme «médiane».

Nous pouvons créer un box plot en utilisant la commande suivante -

> p <- ggplot(mpg, aes(class, cty)) +
+  geom_boxplot(varwidth=T, fill="blue")
> p + labs(title="A Box plot Example",
+    subtitle="Mileage by Class",
+    caption="MPG Dataset",
+    x="Class",
+    y="Mileage")
>p

Ici, nous créons un box plot en ce qui concerne les attributs de classe et cty.

Tracé de points

Les tracés de points sont similaires aux tracés dispersés avec seulement une différence de dimension. Dans cette section, nous ajouterons un diagramme à points à la boîte à moustaches existante pour avoir une meilleure image et une meilleure clarté.

Le box plot peut être créé à l'aide de la commande suivante -

> p <- ggplot(mpg, aes(manufacturer, cty)) +
+    geom_boxplot() +
+    theme(axis.text.x = element_text(angle=65, vjust=0.6))
> p

Le dot plot est créé comme indiqué ci-dessous -

> p + geom_dotplot(binaxis='y',
+    stackdir='center',
+    dotsize = .5
+    )

Parcelle de violon

L'intrigue de violon est également créée de manière similaire avec seulement un changement de structure des violons au lieu de la boîte. La sortie est clairement mentionnée ci-dessous -

> p <- ggplot(mpg, aes(class, cty))
>
> p + geom_violin()