Seaborn - Estimasi Statistik

Dalam sebagian besar situasi, kami menangani estimasi dari seluruh distribusi data. Namun dalam hal estimasi tendensi sentral, diperlukan cara khusus untuk meringkas distribusinya. Mean dan median adalah teknik yang paling sering digunakan untuk memperkirakan tendensi sentral dari distribusi.

Di semua plot yang kami pelajari di bagian di atas, kami membuat visualisasi dari keseluruhan distribusi. Sekarang, mari kita bahas tentang plot yang dapat kita gunakan untuk memperkirakan tendensi sentral distribusi.

Plot Batang

Itu barplot()menunjukkan hubungan antara variabel kategorikal dan variabel kontinu. Data direpresentasikan dalam bentuk balok persegi panjang dimana panjang balok mewakili proporsi data dalam kategori tersebut.

Plot batang mewakili estimasi tendensi sentral. Mari kita gunakan dataset 'titanic' untuk mempelajari plot batang.

Contoh

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.barplot(x = "sex", y = "survived", hue = "class", data = df)
plt.show()

Keluaran

Pada contoh di atas, kita dapat melihat bahwa jumlah rata-rata ketahanan hidup laki-laki dan perempuan di setiap kelas. Dari plot tersebut kita dapat memahami bahwa lebih banyak perempuan yang bertahan hidup daripada laki-laki. Pada pria dan wanita lebih banyak jumlah yang selamat dari kelas satu.

Kasus khusus dalam barplot adalah menunjukkan tidak adanya pengamatan di setiap kategori daripada menghitung statistik untuk variabel kedua. Untuk ini, kami menggunakancountplot().

Contoh

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.countplot(x = " class ", data = df, palette = "Blues");
plt.show()

Keluaran

Plot menyebutkan, jumlah penumpang kelas tiga lebih banyak dibandingkan kelas satu dan dua.

Plot Titik

Plot titik berfungsi sama seperti plot batang tetapi dalam gaya yang berbeda. Daripada batang penuh, nilai perkiraan diwakili oleh titik pada ketinggian tertentu di sumbu lain.

Contoh

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.pointplot(x = "sex", y = "survived", hue = "class", data = df)
plt.show()

Keluaran