Statistik - Restanalyse

Die Residuenanalyse wird verwendet, um die Angemessenheit eines linearen Regressionsmodells zu bewerten, indem Residuen definiert und die Residuendiagramme untersucht werden.

Restwert

Der Restwert ($ e $) bezieht sich auf die Differenz zwischen dem beobachteten Wert ($ y $) und dem vorhergesagten Wert ($ \ hat y $). Jeder Datenpunkt hat einen Rest.

$ {Residual = ObservatedValue - PredictedValue \\ [7pt] e = y - \ hat y} $

Restgrundstück

Ein Residuendiagramm ist ein Diagramm, in dem Residuen auf der vertikalen Achse und die unabhängige Variable auf der horizontalen Achse liegen. Wenn die Punkte zufällig um die horizontale Achse verteilt sind, ist ein lineares Regressionsmodell für die Daten geeignet. Andernfalls wählen Sie ein nichtlineares Modell.

Arten von Restplots

Das folgende Beispiel zeigt einige Muster in Restdiagrammen.

Im ersten Fall werden Punkte zufällig verteilt. Daher wird ein lineares Regressionsmodell bevorzugt. Im zweiten und dritten Fall sind Punkte nicht zufällig verteilt und legen nahe, dass eine nichtlineare Regressionsmethode bevorzugt wird.

Beispiel

Problem Statement:

Überprüfen Sie, wo ein lineares Regressionsmodell für die folgenden Daten geeignet ist.

$ x $ 60 70 80 85 95
$ y $ (Istwert) 70 65 70 95 85
$ \ hat y $ (vorhergesagter Wert) 65.411 71,849 78,288 81,507 87,945

Solution:

Step 1: Berechnen Sie Residuen für jeden Datenpunkt.

$ x $ 60 70 80 85 95
$ y $ (Istwert) 70 65 70 95 85
$ \ hat y $ (vorhergesagter Wert) 65.411 71,849 78,288 81,507 87,945
$ e $ (Rest) 4,589 -6,849 -8,288 13.493 -2,945

Step 2: - Zeichnen Sie das Restdiagramm.

Step 3: - Überprüfen Sie die Zufälligkeit der Residuen.

Hier zeigt das Residuendiagramm ein zufälliges Muster - Das erste Residuum ist positiv, die folgenden zwei sind negativ, das vierte ist positiv und das letzte Residuum ist negativ. Da das Muster ziemlich zufällig ist, zeigt dies an, dass ein lineares Regressionsmodell für die obigen Daten geeignet ist.