Statistik - Analisis sisa

Analisis residual digunakan untuk menilai kesesuaian model regresi linier dengan mendefinisikan residual dan memeriksa grafik plot residual.

Sisa

Sisa ($ e $) mengacu pada perbedaan antara nilai observasi ($ y $) vs nilai prediksi ($ \ hat y $). Setiap titik data memiliki satu residu.

$ {residual = observasiValue - predictValue \\ [7pt] e = y - \ hat y} $

Petak Sisa

Plot residual adalah grafik di mana residual berada pada sumbu vertikal dan variabel bebas berada pada sumbu horizontal. Jika titik-titik tersebar secara acak di sekitar sumbu horizontal, maka model regresi linier sesuai untuk data; jika tidak, pilih model non-linier.

Jenis Petak Sisa

Contoh berikut menunjukkan beberapa pola di petak sisa.

Dalam kasus pertama, titik-titik tersebar secara acak. Jadi model regresi linier lebih disukai. Dalam kasus kedua dan ketiga, titik-titik tidak tersebar secara acak dan menunjukkan bahwa metode regresi non-linier lebih disukai.

Contoh

Problem Statement:

Periksa di mana model regresi linier sesuai untuk data berikut.

$ x $ 60 70 80 85 95
$ y $ (Nilai Aktual) 70 65 70 95 85
$ \ hat y $ (Nilai Prediksi) 65.411 71.849 78.288 81.507 87.945

Solution:

Step 1: Hitung residu untuk setiap titik data.

$ x $ 60 70 80 85 95
$ y $ (Nilai Aktual) 70 65 70 95 85
$ \ hat y $ (Nilai Prediksi) 65.411 71.849 78.288 81.507 87.945
$ e $ (Sisa) 4.589 -6,849 -8.288 13.493 -2,945

Step 2: - Gambar grafik plot sisa.

Step 3: - Periksa keacakan residu.

Di sini plot residual menunjukkan pola acak - Residual pertama positif, dua negatif, keempat positif, dan residual terakhir negatif. Karena pola cukup acak yang menunjukkan bahwa model regresi linier sesuai untuk data di atas.