SAS - Korrelationsanalyse
Die Korrelationsanalyse befasst sich mit Beziehungen zwischen Variablen. Der Korrelationskoeffizient ist ein Maß für die lineare Assoziation zwischen zwei Variablen. Die Werte des Korrelationskoeffizienten liegen immer zwischen -1 und +1. SAS stellt das Verfahren bereitPROC CORR um die Korrelationskoeffizienten zwischen einem Variablenpaar in einem Datensatz zu finden.
Syntax
Die grundlegende Syntax zum Anwenden von PROC CORR in SAS lautet -
PROC CORR DATA = dataset options;
VAR variable;
Es folgt die Beschreibung der verwendeten Parameter -
Dataset ist der Name des Datensatzes.
Options ist die zusätzliche Option bei Verfahren wie dem Zeichnen einer Matrix usw.
Variable ist der Variablenname des Datensatzes, der zum Ermitteln der Korrelation verwendet wird.
Beispiel
Korrelationskoeffizienten zwischen einem in einem Datensatz verfügbaren Variablenpaar können mithilfe ihrer Namen in der VAR-Anweisung ermittelt werden. Im folgenden Beispiel verwenden wir den Datensatz CARS1 und erhalten das Ergebnis, das die Korrelationskoeffizienten zwischen Leistung und Gewicht zeigt.
PROC SQL;
create table CARS1 as
SELECT invoice, horsepower, length, weight
FROM
SASHELP.CARS
WHERE make in ('Audi','BMW')
;
RUN;
proc corr data = cars1 ;
VAR horsepower weight ;
BY make;
run;
Wenn der obige Code ausgeführt wird, erhalten wir das folgende Ergebnis:
Korrelation zwischen allen Variablen
Korrelationskoeffizienten zwischen allen in einem Datensatz verfügbaren Variablen können durch einfaches Anwenden der Prozedur mit dem Datensatznamen erhalten werden.
Beispiel
Im folgenden Beispiel verwenden wir den Datensatz CARS1 und erhalten das Ergebnis, das die Korrelationskoeffizienten zwischen jedem Variablenpaar zeigt.
proc corr data = cars1 ;
run;
Wenn der obige Code ausgeführt wird, erhalten wir das folgende Ergebnis:
Korrelationsmatrix
Wir können eine Streudiagrammmatrix zwischen den Variablen erhalten, indem wir die Option zum Zeichnen der Matrix in der auswählen PROC Erklärung.
Beispiel
Im folgenden Beispiel erhalten wir die Matrix zwischen Leistung und Gewicht.
proc corr data = cars1 plots = matrix ;
VAR horsepower weight ;
run;
Wenn der obige Code ausgeführt wird, erhalten wir das folgende Ergebnis: