Seaborn - Visualisation de la relation par paires

Les ensembles de données sous étude en temps réel contiennent de nombreuses variables. Dans de tels cas, la relation entre chaque variable doit être analysée. Tracer la distribution bivariée pour (n, 2) combinaisons sera un processus très complexe et prenant du temps.

Pour tracer plusieurs distributions bivariées par paires dans un jeu de données, vous pouvez utiliser pairplot()fonction. Cela montre la relation pour (n, 2) combinaison de variable dans un DataFrame sous forme de matrice de tracés et les tracés diagonaux sont les tracés univariés.

Haches

Dans cette section, nous allons apprendre ce que sont les axes, leur utilisation, leurs paramètres, etc.

Usage

seaborn.pairplot(data,…)

Paramètres

Le tableau suivant répertorie les paramètres des axes -

N ° Sr. Paramètre et description
1

data

Trame de données

2

hue

Variable dans les données pour mapper les aspects du tracé à différentes couleurs.

3

palette

Ensemble de couleurs pour mapper la variable de teinte

4

kind

Genre d'intrigue pour les relations non identitaires. {'scatter', 'reg'}

5

diag_kind

Type de tracé pour les sous-tracés diagonaux. {'hist', 'kde'}

À l'exception des données, tous les autres paramètres sont facultatifs. Il y a peu d'autres paramètres quipairplotPeut accepter. Les paramètres mentionnés ci-dessus sont souvent utilisés.

Exemple

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.set_style("ticks")
sb.pairplot(df,hue = 'species',diag_kind = "kde",kind = "scatter",palette = "husl")
plt.show()

Production

Nous pouvons observer les variations dans chaque parcelle. Les tracés sont au format matriciel où le nom de ligne représente l'axe x et le nom de colonne représente l'axe y.

Les tracés diagonaux sont des tracés de densité de noyau où les autres tracés sont des diagrammes de dispersion comme mentionné.