ggplot2 - Multiple Plots
Neste capítulo, vamos nos concentrar na criação de gráficos múltiplos que podem ser usados posteriormente para criar gráficos tridimensionais. A lista de parcelas que serão cobertas inclui -
- Gráfico de densidade
- Box Plot
- Dot Plot
- Enredo de violino
Usaremos o conjunto de dados “mpg” como usado nos capítulos anteriores. Este conjunto de dados fornece dados de economia de combustível de 1999 e 2008 para 38 modelos populares de carros. O conjunto de dados é enviado com o pacote ggplot2. É importante seguir o passo abaixo mencionado para criar diferentes tipos de parcelas.
> # Load Modules
> library(ggplot2)
>
> # Dataset
> head(mpg)
# A tibble: 6 x 11
manufacturer model displ year cyl trans drv cty hwy fl class
<chr> <chr> <dbl> <int> <int> <chr> <chr> <int> <int> <chr> <chr>
1 audi a4 1.8 1999 4 auto(l5) f 18 29 p compa~
2 audi a4 1.8 1999 4 manual(m5) f 21 29 p compa~
3 audi a4 2 2008 4 manual(m6) f 20 31 p compa~
4 audi a4 2 2008 4 auto(av) f 21 30 p compa~
5 audi a4 2.8 1999 6 auto(l5) f 16 26 p compa~
6 audi a4 2.8 1999 6 manual(m5) f 18 26 p compa~
Gráfico de densidade
Um gráfico de densidade é uma representação gráfica da distribuição de qualquer variável numérica no conjunto de dados mencionado. Ele usa uma estimativa de densidade de kernel para mostrar a função de densidade de probabilidade da variável.
O pacote “ggplot2” inclui uma função chamada geom_density () para criar um gráfico de densidade.
Vamos executar o seguinte comando para criar um gráfico de densidade -
> p −- ggplot(mpg, aes(cty)) +
+ geom_density(aes(fill=factor(cyl)), alpha=0.8)
> p
Podemos observar várias densidades do gráfico criado abaixo -
Podemos criar o gráfico renomeando os eixos xey, o que mantém melhor clareza com inclusão de título e legendas com diferentes combinações de cores.
> p + labs(title="Density plot",
+ subtitle="City Mileage Grouped by Number of cylinders",
+ caption="Source: mpg",
+ x="City Mileage",
+ fill="# Cylinders")
Box Plot
O gráfico de caixa também chamado de gráfico de caixa e bigode representa o resumo de cinco números dos dados. Os cinco resumos de números incluem valores como mínimo, primeiro quartil, mediana, terceiro quartil e máximo. A linha vertical que passa pela parte central do gráfico de caixa é considerada como “mediana”.
Podemos criar box plot usando o seguinte comando -
> p <- ggplot(mpg, aes(class, cty)) +
+ geom_boxplot(varwidth=T, fill="blue")
> p + labs(title="A Box plot Example",
+ subtitle="Mileage by Class",
+ caption="MPG Dataset",
+ x="Class",
+ y="Mileage")
>p
Aqui, estamos criando um gráfico de caixa com relação aos atributos de classe e cty.
Dot Plot
Os gráficos de pontos são semelhantes aos gráficos dispersos, apenas com diferença de dimensão. Nesta seção, iremos adicionar o gráfico de pontos ao gráfico de caixa existente para ter uma imagem melhor e clareza.
O box plot pode ser criado usando o seguinte comando -
> p <- ggplot(mpg, aes(manufacturer, cty)) +
+ geom_boxplot() +
+ theme(axis.text.x = element_text(angle=65, vjust=0.6))
> p
O gráfico de pontos é criado conforme mencionado abaixo -
> p + geom_dotplot(binaxis='y',
+ stackdir='center',
+ dotsize = .5
+ )
Enredo de violino
O enredo do violino também é criado de maneira semelhante, apenas com a mudança da estrutura dos violinos em vez da caixa. O resultado é claramente mencionado abaixo -
> p <- ggplot(mpg, aes(class, cty))
>
> p + geom_violin()