Seaborn - Hình dung mối quan hệ theo cặp
Tập dữ liệu trong nghiên cứu thời gian thực chứa nhiều biến. Trong những trường hợp như vậy, mối quan hệ giữa mỗi và mọi biến cần được phân tích. Lập đồ thị Phân phối Bivariate cho (n, 2) kết hợp sẽ là một quá trình rất phức tạp và mất thời gian.
Để vẽ biểu đồ nhiều phân phối song biến theo cặp trong một tập dữ liệu, bạn có thể sử dụng pairplot()chức năng. Điều này cho thấy mối quan hệ đối với (n, 2) sự kết hợp của biến trong DataFrame dưới dạng ma trận các ô và các ô đường chéo là các ô đơn biến.
Axes
Trong phần này, chúng ta sẽ tìm hiểu Axes là gì, cách sử dụng, các thông số của chúng, v.v.
Sử dụng
seaborn.pairplot(data,…)
Thông số
Bảng sau liệt kê các thông số cho Axes -
Sr.No. | Mô tả về Thông Số |
---|---|
1 | data Khung dữ liệu |
2 | hue Có thể thay đổi dữ liệu để ánh xạ các khía cạnh của ô thành các màu khác nhau. |
3 | palette Tập hợp các màu để ánh xạ biến màu |
4 | kind Loại cốt truyện cho các mối quan hệ không danh tính. {'scatter', 'reg'} |
5 | diag_kind Loại âm mưu cho các ô đường chéo. {'hist', 'kde'} |
Ngoại trừ dữ liệu, tất cả các thông số khác là tùy chọn. Có một số tham số khácpairplotcó thể chấp nhận. Những điều được đề cập ở trên thường được sử dụng params.
Thí dụ
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.set_style("ticks")
sb.pairplot(df,hue = 'species',diag_kind = "kde",kind = "scatter",palette = "husl")
plt.show()
Đầu ra
Chúng ta có thể quan sát các biến thể trong mỗi âm mưu. Các ô có định dạng ma trận trong đó tên hàng thể hiện trục x và tên cột biểu thị trục y.
Các ô đường chéo là các ô mật độ nhân trong đó các ô khác là các ô phân tán như đã đề cập.