Seaborn - ค่าประมาณความหนาแน่นของเคอร์เนล

การประมาณความหนาแน่นของเคอร์เนล (KDE) เป็นวิธีการประมาณฟังก์ชันความหนาแน่นของความน่าจะเป็นของตัวแปรสุ่มแบบต่อเนื่อง ใช้สำหรับการวิเคราะห์แบบไม่ใช้พารามิเตอร์

การตั้งค่า hist ตั้งค่าสถานะเป็น False in distplot จะได้พล็อตการประมาณความหนาแน่นของเคอร์เนล

ตัวอย่าง

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'],hist=False)
plt.show()

เอาต์พุต

การกระจายพารามิเตอร์ที่เหมาะสม

distplot() ใช้เพื่อแสดงภาพการแจกแจงพารามิเตอร์ของชุดข้อมูล

ตัวอย่าง

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'])
plt.show()

เอาต์พุต

การพล็อตการกระจายแบบสองตัวแปร

Bivariate Distribution ใช้เพื่อกำหนดความสัมพันธ์ระหว่างสองตัวแปร ส่วนใหญ่เกี่ยวข้องกับความสัมพันธ์ระหว่างสองตัวแปรและการทำงานของตัวแปรหนึ่งเมื่อเทียบกับอีกตัวแปรหนึ่ง

วิธีที่ดีที่สุดในการวิเคราะห์ Bivariate Distribution ในทะเลคือการใช้ไฟล์ jointplot() ฟังก์ชัน

Jointplot สร้างตัวเลขหลายแผงที่แสดงความสัมพันธ์แบบสองตัวแปรระหว่างสองตัวแปรและการแจกแจงแบบไม่แปรผันของแต่ละตัวแปรบนแกนที่แยกกัน

พล็อตกระจาย

พล็อตการกระจายเป็นวิธีที่สะดวกที่สุดในการแสดงภาพการกระจายซึ่งการสังเกตแต่ละครั้งแสดงในรูปแบบสองมิติผ่านแกน x และ y

ตัวอย่าง

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df)
plt.show()

เอาต์พุต

รูปด้านบนแสดงความสัมพันธ์ระหว่าง petal_length และ petal_widthในข้อมูล Iris แนวโน้มในพล็อตบอกว่ามีความสัมพันธ์เชิงบวกระหว่างตัวแปรที่ศึกษา

พล็อต Hexbin

Hexagonal binning ใช้ในการวิเคราะห์ข้อมูลแบบสองตัวแปรเมื่อข้อมูลมีความหนาแน่นกระจัดกระจายเช่นเมื่อข้อมูลกระจัดกระจายมากและยากที่จะวิเคราะห์ผ่าน scatterplots

พารามิเตอร์เพิ่มเติมที่เรียกว่า 'ชนิด' และค่า 'ฐานสิบหก' จะแสดงพล็อต hexbin

ตัวอย่าง

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()

การประมาณความหนาแน่นของเคอร์เนล

การประมาณความหนาแน่นของเคอร์เนลเป็นวิธีที่ไม่ใช่พารามิเตอร์ในการประมาณการแจกแจงของตัวแปร ในทะเลเราสามารถพล็อต kde โดยใช้jointplot().

ส่งค่า 'kde' ไปยังชนิดพารามิเตอร์เพื่อลงจุดเคอร์เนลพล็อต

ตัวอย่าง

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()

เอาต์พุต