Seaborn - Perkiraan Densitas Kernel

Kernel Density Estimation (KDE) adalah cara untuk memperkirakan fungsi kepadatan probabilitas dari variabel acak kontinu. Ini digunakan untuk analisis non-parametrik.

Mengatur hist tandai menjadi False in distplot akan menghasilkan plot estimasi kepadatan kernel.

Contoh

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'],hist=False)
plt.show()

Keluaran

Distribusi Parametrik Pemasangan

distplot() digunakan untuk memvisualisasikan distribusi parametrik dari kumpulan data.

Contoh

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'])
plt.show()

Keluaran

Merencanakan Distribusi Bivariat

Distribusi Bivariat digunakan untuk mengetahui hubungan antara dua variabel. Ini terutama berkaitan dengan hubungan antara dua variabel dan bagaimana satu variabel berperilaku terhadap yang lain.

Cara terbaik untuk menganalisis Distribusi Bivariat di seaborn adalah dengan menggunakan jointplot() fungsi.

Jointplot membuat gambar multi panel yang memproyeksikan hubungan bivariat antara dua variabel dan juga distribusi univariat dari setiap variabel pada sumbu terpisah.

Plot Sebar

Plot sebar adalah cara paling mudah untuk memvisualisasikan distribusi di mana setiap pengamatan direpresentasikan dalam plot dua dimensi melalui sumbu x dan y.

Contoh

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df)
plt.show()

Keluaran

Gambar di atas menunjukkan hubungan antara petal_length dan petal_widthdalam data Iris. Tren dalam plot mengatakan bahwa korelasi positif ada antara variabel yang diteliti.

Hexbin Plot

Hexagonal binning digunakan dalam analisis data bivariat ketika data memiliki kepadatan yang jarang, yaitu ketika data sangat tersebar dan sulit untuk dianalisis melalui sebar.

Parameter tambahan yang disebut 'jenis' dan nilai 'hex' memplot plot hexbin.

Contoh

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()

Estimasi Densitas Kernel

Estimasi kepadatan kernel adalah cara non-parametrik untuk memperkirakan distribusi variabel. Di dasar laut, kita bisa memplot kde menggunakanjointplot().

Berikan nilai 'kde' ke jenis parameter untuk memplot plot kernel.

Contoh

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()

Keluaran