SAS - wykresy punktowe

Wykres rozrzutu to rodzaj wykresu, który wykorzystuje wartości dwóch zmiennych wykreślonych na płaszczyźnie kartezjańskiej. Zwykle służy do znalezienia związku między dwiema zmiennymi. W SAS używamyPROC SGSCATTER do tworzenia wykresów rozrzutu.

Należy pamiętać, że w pierwszym przykładzie tworzymy zbiór danych o nazwie CARS1 i używamy tego samego zestawu danych dla wszystkich kolejnych zestawów danych. Ten zestaw danych pozostaje w bibliotece roboczej do końca sesji SAS.

Składnia

Podstawowa składnia tworzenia wykresu punktowego w SAS to -

PROC sgscatter  DATA = DATASET;
   PLOT VARIABLE_1 * VARIABLE_2
   / datalabel = VARIABLE group = VARIABLE;
RUN;

Poniżej znajduje się opis użytych parametrów -

  • DATASET to nazwa zbioru danych.

  • VARIABLE jest zmienną używaną ze zbioru danych.

Prosty wykres rozrzutu

Na prostym wykresie rozrzutu wybieramy dwie zmienne ze zbioru danych i grupujemy je według trzeciej zmiennej. Możemy również oznaczyć dane. Wynik pokazuje, jak dwie zmienne są rozproszone wCartesian plane.

Przykład

PROC SQL;
create table CARS1 as
SELECT make, model, type, invoice, horsepower, length, weight
FROM 
SASHELP.CARS
WHERE make in ('Audi','BMW')
;
RUN;

TITLE 'Scatterplot - Two Variables';
PROC sgscatter  DATA = CARS1;
   PLOT horsepower*Invoice 
   / datalabel = make group = type grid;
   title 'Horsepower vs. Invoice for car makers by types';
RUN;

Kiedy wykonujemy powyższy kod, otrzymujemy następujący wynik -

Wykres rozrzutu z prognozą

możemy użyć parametru estymacji, aby przewidzieć siłę korelacji między, rysując elipsę wokół wartości. Używamy dodatkowych opcji w procedurze, aby narysować elipsę, jak pokazano poniżej.

Przykład

proc sgscatter data = cars1; 
compare y = Invoice  x = (horsepower length)  
         / group = type  ellipse =(alpha = 0.05 type = predicted); 
title
'Average Invoice vs. horsepower for cars by length'; 
title2
'-- with 95% prediction ellipse --'
; 
format
Invoice dollar6.0;
run;

Kiedy wykonujemy powyższy kod, otrzymujemy następujący wynik -

Matryca rozproszona

Możemy również utworzyć wykres rozrzutu obejmujący więcej niż dwie zmienne, grupując je w pary. W poniższym przykładzie rozważymy trzy zmienne i narysujemy macierz wykresów punktowych. Otrzymujemy 3 pary wynikowej macierzy.

Przykład

PROC sgscatter  DATA = CARS1;
   matrix horsepower invoice length
   / group = type;

   title 'Horsepower vs. Invoice vs. Length for car makers by types';
RUN;

Kiedy wykonujemy powyższy kod, otrzymujemy następujący wynik -