Python-箱ひげ図

箱ひげ図は、データセット内のデータがどの程度適切に分散されているかを示す尺度です。データセットを3つの四分位数に分割します。このグラフは、データセットの最小、最大、中央値、第1四分位数、および第3四分位数を表します。また、データセットごとに箱ひげ図を描くことで、データセット間のデータの分布を比較するのにも役立ちます。

箱ひげ図を描く

箱ひげ図は、Series.box.plot()とDataFrame.box.plot()、またはDataFrame.boxplot()を呼び出して描画し、各列内の値の分布を視覚化できます。

たとえば、これは[0,1)の一様確率変数の10回の観測の5回の試行を表す箱ひげ図です。

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
df.plot.box(grid='True')

その output 次のとおりです-