Statistik - Goodness of Fit

Itu Goodness of Fittes digunakan untuk memeriksa data sampel apakah cocok dari distribusi populasi. Populasi mungkin memiliki distribusi normal atau distribusi Weibull. Dengan kata sederhana, ini menandakan bahwa data sampel mewakili data dengan benar yang kami harapkan dapat ditemukan dari populasi sebenarnya. Tes berikut biasanya digunakan oleh ahli statistik:

  • Chi-square

  • Kolmogorov-Smirnov

  • Anderson-Darling

  • Shipiro-Wilk

Uji Chi-square

Uji chi-square adalah yang paling umum digunakan untuk menguji uji kecocokan dan digunakan untuk distribusi diskrit seperti distribusi binomial dan distribusi Poisson, sedangkan uji kecocokan Kolmogorov-Smirnov dan Anderson-Darling digunakan untuk distribusi kontinu .

Rumus

$ {X ^ 2 = \ jumlah {[\ frac {(O_i - E_i) ^ 2} {E_i}]}} $

Dimana -

  • $ {O_i} $ = nilai observasi dari level variabel ke-i.

  • $ {E_i} $ = nilai yang diharapkan dari tingkat variabel ke-i.

  • $ {X ^ 2} $ = chi-squared variabel acak.

Contoh

Perusahaan mainan membangun mainan pemain sepak bola. Diklaim bahwa 30% dari kartu adalah mid-fielder, 60% defender, dan 10% untuk penyerang. Mempertimbangkan sampel acak dari 100 mainan memiliki 50 pemain tengah, 45 pemain bertahan, dan 5 pemain depan. Dengan tingkat signifikansi 0,05, dapatkah Anda membenarkan klaim perusahaan?

Solution:

Tentukan Hipotesis

  • Null hypothesis $ H_0 $ - Proporsi pemain tengah, bek, dan penyerang masing-masing adalah 30%, 60%, dan 10%.

  • Alternative hypothesis $ H_1 $ - Setidaknya salah satu proporsi dalam hipotesis nol salah.

Tentukan Derajat Kebebasan

Derajat kebebasan, DF sama dengan banyaknya tingkatan (k) dari variabel kategorikal dikurangi 1: DF = k - 1. Berikut tingkatannya 3. Jadi

$ {DF = k - 1 \\ [7pt] \, = 3 -1 = 2} $

Tentukan statistik uji chi-square

$ {X ^ 2 = \ jumlah {[\ frac {(O_i - E_i) ^ 2} {E_i}]} \\ [7pt] \, = [\ frac {(50-30) ^ 2} {30}] + [\ frac {(45-60) ^ 2} {60}] + [\ frac {(5-10) ^ 2} {10}] \\ [7pt] \, = \ frac {400} {30} + \ frac {225} {60} + \ frac {25} {10} \\ [7pt] \, = 13,33 + 3,75 + 2,50 \\ [7pt] \, = 19,58} $

Tentukan nilai p

Nilai-P adalah probabilitas bahwa statistik chi-square, $ X ^ 2 $ memiliki 2 derajat kebebasan lebih ekstrim dari 19,58. Gunakan Kalkulator Distribusi Chi-Square untuk menemukan $ {P (X ^ 2 \ gt 19,58) = 0,0001} $.

Interpretasikan hasil

Karena nilai-P (0,0001) lebih kecil dari tingkat signifikansi (0,05), hipotesis nol tidak dapat diterima. Dengan demikian klaim perusahaan tidak valid.