Seaborn - Visualizando o relacionamento entre pares

Os conjuntos de dados em estudo em tempo real contêm muitas variáveis. Nesses casos, a relação entre cada uma das variáveis ​​deve ser analisada. Traçar a distribuição bivariada para combinações (n, 2) será um processo muito complexo e demorado.

Para plotar várias distribuições bivariadas de pares em um conjunto de dados, você pode usar o pairplot()função. Isso mostra a relação para (n, 2) combinação de variável em um DataFrame como uma matriz de gráficos e os gráficos diagonais são os gráficos univariados.

Eixos

Nesta seção, aprenderemos o que são eixos, seu uso, parâmetros e assim por diante.

Uso

seaborn.pairplot(data,…)

Parâmetros

A tabela a seguir lista os parâmetros para eixos -

Sr. Não. Parâmetro e Descrição
1

data

Quadro de dados

2

hue

Variável em dados para mapear aspectos de plotagem para cores diferentes.

3

palette

Conjunto de cores para mapear a variável matiz

4

kind

Tipo de trama para as relações de não identidade. {'scatter', 'reg'}

5

diag_kind

Tipo de plotagem para subtramas diagonais. {'hist', 'kde'}

Exceto os dados, todos os outros parâmetros são opcionais. Existem alguns outros parâmetros quepairplotpode aceitar. Os parâmetros mencionados acima são freqüentemente usados.

Exemplo

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.set_style("ticks")
sb.pairplot(df,hue = 'species',diag_kind = "kde",kind = "scatter",palette = "husl")
plt.show()

Resultado

Podemos observar as variações em cada parcela. Os gráficos estão em formato de matriz onde o nome da linha representa o eixo xe o nome da coluna representa o eixo y.

Os gráficos diagonais são gráficos de densidade de kernel, onde os outros gráficos são gráficos de dispersão, conforme mencionado.