Seaborn: como adicionar legenda ao barplot seaborn

Dec 12 2020

Estou tentando adicionar uma legenda ao seaborngráfico do meu bar. Já tentei adicionar matiz, mas aparece um erro dizendo IndexingError: Unalignable boolean Series provided as indexer (index of the boolean Series and of the indexed object do not match).que tentei outra solução, dando-lhe o parâmetro de rótulos. Aqui está o código

plt.figure(figsize=[15,12])                     
sns.barplot(x=customer['gender'].unique(),y=customer.groupby(['gender'])['gender'].count(),
            data=customer,label=customer['gender'].unique())
plt.legend(loc="upper left")

Este é o resultado, este resultado está errado. É suposto ter rótulos Feminino e Masculino de acordo com a cor no bar. O feminino e o masculino devem ser separados com cores diferentes. Já tentei seguir isso , isso e isso, mas nada disso funciona para mim. Como devo fazer isso?

Respostas

1 lys Dec 13 2020 at 07:06

Aqui está um liner que você pode usar em seu código existente, definindo o handlesparâmetro para a legenda:

patches = [matplotlib.patches.Patch(color=sns.color_palette()[i], label=t) for i,t in enumerate(t.get_text() for t in plot.get_xticklabels())]

Use assim:

plt.legend(handles=patches, loc="upper left") 

Script completo:

import seaborn as sns
import matplotlib.pyplot as plt
import matplotlib
import pandas as pd
import numpy as np
import random

#generate random test data
genders = ['Male', 'Female']
sampling = random.choices(genders, k=100)
customer = pd.DataFrame({'gender': sampling})

#you can change the palette and it will still work
sns.set_palette("Accent")
                  
plot = sns.barplot(x=customer['gender'].unique(),y=customer.groupby(['gender'])['gender'].count(),
            data=customer) 

patches = [matplotlib.patches.Patch(color=sns.color_palette()[i], label=t) for i,t in enumerate(t.get_text() for t in plot.get_xticklabels())]
plt.legend(handles=patches, loc="upper left")    
3 StupidWolf Dec 13 2020 at 06:54

Acho que você está complicando demais as coisas com o groupby. Você pode usar o sns.countplot:

customer = pd.DataFrame({'gender':np.random.choice(["Male","Female"],100)})
sns.countplot(x='gender',hue='gender',data=customer,dodge=False)