SAS - Korrelationsanalyse

Die Korrelationsanalyse befasst sich mit Beziehungen zwischen Variablen. Der Korrelationskoeffizient ist ein Maß für die lineare Assoziation zwischen zwei Variablen. Die Werte des Korrelationskoeffizienten liegen immer zwischen -1 und +1. SAS stellt das Verfahren bereitPROC CORR um die Korrelationskoeffizienten zwischen einem Variablenpaar in einem Datensatz zu finden.

Syntax

Die grundlegende Syntax zum Anwenden von PROC CORR in SAS lautet -

PROC CORR DATA = dataset options;
VAR variable;

Es folgt die Beschreibung der verwendeten Parameter -

  • Dataset ist der Name des Datensatzes.

  • Options ist die zusätzliche Option bei Verfahren wie dem Zeichnen einer Matrix usw.

  • Variable ist der Variablenname des Datensatzes, der zum Ermitteln der Korrelation verwendet wird.

Beispiel

Korrelationskoeffizienten zwischen einem in einem Datensatz verfügbaren Variablenpaar können mithilfe ihrer Namen in der VAR-Anweisung ermittelt werden. Im folgenden Beispiel verwenden wir den Datensatz CARS1 und erhalten das Ergebnis, das die Korrelationskoeffizienten zwischen Leistung und Gewicht zeigt.

PROC SQL;
create table CARS1 as
SELECT invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc corr data = cars1 ;
VAR horsepower weight ;
BY make;
run;

Wenn der obige Code ausgeführt wird, erhalten wir das folgende Ergebnis:

Korrelation zwischen allen Variablen

Korrelationskoeffizienten zwischen allen in einem Datensatz verfügbaren Variablen können durch einfaches Anwenden der Prozedur mit dem Datensatznamen erhalten werden.

Beispiel

Im folgenden Beispiel verwenden wir den Datensatz CARS1 und erhalten das Ergebnis, das die Korrelationskoeffizienten zwischen jedem Variablenpaar zeigt.

proc corr data = cars1 ;
run;

Wenn der obige Code ausgeführt wird, erhalten wir das folgende Ergebnis:

Korrelationsmatrix

Wir können eine Streudiagrammmatrix zwischen den Variablen erhalten, indem wir die Option zum Zeichnen der Matrix in der auswählen PROC Erklärung.

Beispiel

Im folgenden Beispiel erhalten wir die Matrix zwischen Leistung und Gewicht.

proc corr data = cars1 plots = matrix ;
VAR horsepower weight ;
run;

Wenn der obige Code ausgeführt wird, erhalten wir das folgende Ergebnis: