Seaborn - Estimativas de densidade do kernel
A estimativa de densidade do kernel (KDE) é uma maneira de estimar a função de densidade de probabilidade de uma variável aleatória contínua. É usado para análises não paramétricas.
Configurando o hist sinalizar como falso em distplot irá produzir o gráfico de estimativa da densidade do kernel.
Exemplo
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'],hist=False)
plt.show()
Resultado
Distribuição Paramétrica de Ajuste
distplot() é usado para visualizar a distribuição paramétrica de um conjunto de dados.
Exemplo
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'])
plt.show()
Resultado
Plotando distribuição bivariada
A distribuição bivariada é usada para determinar a relação entre duas variáveis. Isso lida principalmente com o relacionamento entre duas variáveis e como uma variável está se comportando em relação à outra.
A melhor maneira de analisar a distribuição bivariada em peixes do mar é usando o jointplot() função.
Jointplot cria uma figura de vários painéis que projeta a relação bivariada entre duas variáveis e também a distribuição univariada de cada variável em eixos separados.
Gráfico de dispersão
O gráfico de dispersão é a maneira mais conveniente de visualizar a distribuição onde cada observação é representada em um gráfico bidimensional através dos eixos xey.
Exemplo
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df)
plt.show()
Resultado
A figura acima mostra a relação entre o petal_length e petal_widthnos dados da íris. Uma tendência no gráfico diz que existe correlação positiva entre as variáveis em estudo.
Hexbin Plot
O binning hexagonal é usado na análise de dados bivariados quando os dados são esparsos em densidade, ou seja, quando os dados estão muito dispersos e difíceis de analisar por meio de gráficos de dispersão.
Um parâmetro de adição chamado 'tipo' e valor 'hex' traça o gráfico hexbin.
Exemplo
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()
Estimativa de densidade do kernel
A estimativa da densidade do kernel é uma forma não paramétrica de estimar a distribuição de uma variável. No seaborn, podemos traçar um kde usandojointplot().
Passe o valor 'kde' para o tipo de parâmetro para traçar o gráfico do kernel.
Exemplo
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()