Seaborn-범주 형 데이터 플로팅

이전 장에서는 연구중인 연속 변수를 분석하는 데 사용되는 산점도, 헥스 빈 플롯 및 kde 플롯에 대해 배웠습니다. 이 그림은 연구중인 변수가 범주 형인 경우 적합하지 않습니다.

연구중인 변수 중 하나 또는 둘 모두가 범주 형이면 striplot (), swarmplot () 등과 같은 플롯을 사용합니다. Seaborn은이를위한 인터페이스를 제공합니다.

범주 형 산점도

이 섹션에서는 범주 형 산점도에 대해 알아 봅니다.

stripplot ()

stripplot ()은 연구중인 변수 중 하나가 범주 형일 때 사용됩니다. 축 중 하나를 따라 정렬 된 순서로 데이터를 나타냅니다.

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.stripplot(x = "species", y = "petal_length", data = df)
plt.show()

산출

위의 그림에서 우리는 petal_length각 종에서. 그러나 위의 산점도의 주요 문제점은 산점도의 점이 겹친다는 것입니다. 이러한 종류의 시나리오를 처리하기 위해 'Jitter'매개 변수를 사용합니다.

지터는 데이터에 임의의 노이즈를 추가합니다. 이 매개 변수는 범주 축을 따라 위치를 조정합니다.

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.stripplot(x = "species", y = "petal_length", data = df, jitter = Ture)
plt.show()

산출

이제 포인트 분포를 쉽게 볼 수 있습니다.

Swarmplot ()

'지터'대신 사용할 수있는 또 다른 옵션은 기능입니다. swarmplot(). 이 기능은 각 산점도 점을 범주 축에 배치하여 점이 겹치는 것을 방지합니다.

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.swarmplot(x = "species", y = "petal_length", data = df)
plt.show()

산출