Seaborn - Estimation statistique

Dans la plupart des situations, nous traitons des estimations de l'ensemble de la distribution des données. Mais quand il s'agit d'estimer la tendance centrale, nous avons besoin d'une manière spécifique de résumer la distribution. La moyenne et la médiane sont les techniques très souvent utilisées pour estimer la tendance centrale de la distribution.

Dans toutes les parcelles que nous avons apprises dans la section ci-dessus, nous avons fait la visualisation de l'ensemble de la distribution. Parlons maintenant des parcelles avec lesquelles nous pouvons estimer la tendance centrale de la distribution.

Bar Plot

le barplot()montre la relation entre une variable catégorielle et une variable continue. Les données sont représentées dans des barres rectangulaires où la longueur de la barre représente la proportion des données dans cette catégorie.

Le graphique à barres représente l'estimation de la tendance centrale. Utilisons le jeu de données «titanesque» pour apprendre les graphiques à barres.

Exemple

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.barplot(x = "sex", y = "survived", hue = "class", data = df)
plt.show()

Production

Dans l'exemple ci-dessus, nous pouvons voir que le nombre moyen de survivances des hommes et des femmes dans chaque classe. À partir de l'intrigue, nous pouvons comprendre que plus de femmes ont survécu que d'hommes. Chez les hommes et les femmes, un plus grand nombre de survivants proviennent de la première classe.

Un cas particulier dans le barplot est de montrer le nombre d'observations dans chaque catégorie plutôt que de calculer une statistique pour une deuxième variable. Pour cela, nous utilisonscountplot().

Exemple

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.countplot(x = " class ", data = df, palette = "Blues");
plt.show()

Production

Plot dit que, le nombre de passagers dans la troisième classe est plus élevé que dans la première et la deuxième classe.

Tracés de points

Les tracés de points servent de même que les tracés à barres mais dans un style différent. Plutôt que la barre entière, la valeur de l'estimation est représentée par le point à une certaine hauteur sur l'autre axe.

Exemple

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.pointplot(x = "sex", y = "survived", hue = "class", data = df)
plt.show()

Production