SAS - Analiza korelacji

Analiza korelacji dotyczy relacji między zmiennymi. Współczynnik korelacji jest miarą zależności liniowej między dwiema zmiennymi, wartości współczynnika korelacji zawsze mieszczą się w zakresie od -1 do +1. SAS zapewnia proceduręPROC CORR znaleźć współczynniki korelacji między parą zmiennych w zbiorze danych.

Składnia

Podstawowa składnia stosowania PROC CORR w SAS to -

PROC CORR DATA = dataset options;
VAR variable;

Poniżej znajduje się opis użytych parametrów -

  • Dataset to nazwa zbioru danych.

  • Options to dodatkowa opcja z procedurą, taką jak wykreślanie macierzy itp.

  • Variable to nazwa zmiennej zbioru danych użyta do znalezienia korelacji.

Przykład

Współczynniki korelacji między parą zmiennych dostępnych w zbiorze danych można uzyskać, używając ich nazw w instrukcji VAR W poniższym przykładzie używamy zestawu danych CARS1 i otrzymujemy wynik pokazujący współczynniki korelacji między mocą mechaniczną a masą.

PROC SQL;
create table CARS1 as
SELECT invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc corr data = cars1 ;
VAR horsepower weight ;
BY make;
run;

Po wykonaniu powyższego kodu otrzymujemy następujący wynik -

Korelacja między wszystkimi zmiennymi

Współczynniki korelacji między wszystkimi zmiennymi dostępnymi w zbiorze danych można uzyskać, po prostu stosując procedurę z nazwą zbioru danych.

Przykład

W poniższym przykładzie używamy zestawu danych CARS1 i otrzymujemy wynik pokazujący współczynniki korelacji między każdą parą zmiennych.

proc corr data = cars1 ;
run;

Po wykonaniu powyższego kodu otrzymujemy następujący wynik -

Macierz korelacji

Możemy uzyskać macierz wykresu rozrzutu między zmiennymi, wybierając opcję wykreślania macierzy w formacie PROC komunikat.

Przykład

W poniższym przykładzie otrzymujemy macierz między mocą a masą.

proc corr data = cars1 plots = matrix ;
VAR horsepower weight ;
run;

Po wykonaniu powyższego kodu otrzymujemy następujący wynik -