SAS - Lineare Regression

Die lineare Regression wird verwendet, um die Beziehung zwischen einer abhängigen Variablen und einer oder mehreren unabhängigen Variablen zu identifizieren. Ein Modell der Beziehung wird vorgeschlagen, und Schätzungen der Parameterwerte werden verwendet, um eine geschätzte Regressionsgleichung zu entwickeln.

Anschließend werden verschiedene Tests durchgeführt, um festzustellen, ob das Modell zufriedenstellend ist. Wenn dies der Fall ist, kann die geschätzte Regressionsgleichung verwendet werden, um den Wert der abhängigen Variablen mit gegebenen Werten für die unabhängigen Variablen vorherzusagen. In SAS die ProzedurPROC REG wird verwendet, um das lineare Regressionsmodell zwischen zwei Variablen zu finden.

Syntax

Die grundlegende Syntax zum Anwenden von PROC REG in SAS lautet -

PROC REG DATA = dataset;
MODEL variable_1 = variable_2;

Es folgt die Beschreibung der verwendeten Parameter -

  • Dataset ist der Name des Datensatzes.

  • variable_1 and variable_2 sind die Variablennamen des Datensatzes, der zum Ermitteln der Korrelation verwendet wird.

Beispiel

Das folgende Beispiel zeigt den Prozess zum Ermitteln der Korrelation zwischen den beiden Variablen Leistung und Gewicht eines Autos mithilfe von PROC REG. Im Ergebnis sehen wir die Schnittwerte, die zur Bildung der Regressionsgleichung verwendet werden können.

PROC SQL;
create table CARS1 as
SELECT invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;
proc reg data = cars1;
model horsepower = weight ;
run;

Wenn der obige Code ausgeführt wird, erhalten wir das folgende Ergebnis:

Der obige Code gibt auch die grafische Ansicht verschiedener Schätzungen des Modells, wie unten gezeigt. Als fortschrittliches SAS-Verfahren hört es einfach nicht auf, die Intercept-Werte als Ausgabe anzugeben.