Сиборн - сетка граней
Полезный подход к изучению данных среднего размера - это рисование нескольких экземпляров одного и того же графика на разных подмножествах вашего набора данных.
Этот метод обычно называют «решетчатым» или «решетчатым» построением, и он связан с идеей «малых кратных».
Чтобы использовать эти функции, ваши данные должны находиться в фрейме данных Pandas.
Построение небольших множеств подмножеств данных
В предыдущей главе мы видели пример FacetGrid, в котором класс FacetGrid помогает визуализировать распределение одной переменной, а также взаимосвязь между несколькими переменными отдельно в подмножествах вашего набора данных с использованием нескольких панелей.
FacetGrid можно нарисовать с тремя измерениями - строкой, столбцом и оттенком. Первые два имеют очевидное соответствие получившемуся массиву осей; воспринимайте переменную оттенка как третье измерение вдоль оси глубины, где разные уровни нанесены разными цветами.
FacetGrid объект принимает в качестве входных данных фрейм данных и имена переменных, которые будут формировать размеры строки, столбца или оттенка сетки.
Переменные должны быть категориальными, и данные на каждом уровне переменной будут использоваться для фасета вдоль этой оси.
пример
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('tips')
g = sb.FacetGrid(df, col = "time")
plt.show()
Вывод
В приведенном выше примере мы только что инициализировали facetgrid объект, который на них ничего не рисует.
Основной подход к визуализации данных на этой сетке - использование FacetGrid.map()метод. Давайте посмотрим на распределение подсказок в каждом из этих подмножеств, используя гистограмму.
пример
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('tips')
g = sb.FacetGrid(df, col = "time")
g.map(plt.hist, "tip")
plt.show()
Вывод
Количество графиков больше одного из-за параметра col. Мы обсуждали параметр col в наших предыдущих главах.
Чтобы построить реляционный график, передайте несколько имен переменных.
пример
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('tips')
g = sb.FacetGrid(df, col = "sex", hue = "smoker")
g.map(plt.scatter, "total_bill", "tip")
plt.show()