SAS - wykresy punktowe
Wykres rozrzutu to rodzaj wykresu, który wykorzystuje wartości dwóch zmiennych wykreślonych na płaszczyźnie kartezjańskiej. Zwykle służy do znalezienia związku między dwiema zmiennymi. W SAS używamyPROC SGSCATTER do tworzenia wykresów rozrzutu.
Należy pamiętać, że w pierwszym przykładzie tworzymy zbiór danych o nazwie CARS1 i używamy tego samego zestawu danych dla wszystkich kolejnych zestawów danych. Ten zestaw danych pozostaje w bibliotece roboczej do końca sesji SAS.
Składnia
Podstawowa składnia tworzenia wykresu punktowego w SAS to -
PROC sgscatter DATA = DATASET;
PLOT VARIABLE_1 * VARIABLE_2
/ datalabel = VARIABLE group = VARIABLE;
RUN;
Poniżej znajduje się opis użytych parametrów -
DATASET to nazwa zbioru danych.
VARIABLE jest zmienną używaną ze zbioru danych.
Prosty wykres rozrzutu
Na prostym wykresie rozrzutu wybieramy dwie zmienne ze zbioru danych i grupujemy je według trzeciej zmiennej. Możemy również oznaczyć dane. Wynik pokazuje, jak dwie zmienne są rozproszone wCartesian plane.
Przykład
PROC SQL;
create table CARS1 as
SELECT make, model, type, invoice, horsepower, length, weight
FROM
SASHELP.CARS
WHERE make in ('Audi','BMW')
;
RUN;
TITLE 'Scatterplot - Two Variables';
PROC sgscatter DATA = CARS1;
PLOT horsepower*Invoice
/ datalabel = make group = type grid;
title 'Horsepower vs. Invoice for car makers by types';
RUN;
Kiedy wykonujemy powyższy kod, otrzymujemy następujący wynik -
Wykres rozrzutu z prognozą
możemy użyć parametru estymacji, aby przewidzieć siłę korelacji między, rysując elipsę wokół wartości. Używamy dodatkowych opcji w procedurze, aby narysować elipsę, jak pokazano poniżej.
Przykład
proc sgscatter data = cars1;
compare y = Invoice x = (horsepower length)
/ group = type ellipse =(alpha = 0.05 type = predicted);
title
'Average Invoice vs. horsepower for cars by length';
title2
'-- with 95% prediction ellipse --'
;
format
Invoice dollar6.0;
run;
Kiedy wykonujemy powyższy kod, otrzymujemy następujący wynik -
Matryca rozproszona
Możemy również utworzyć wykres rozrzutu obejmujący więcej niż dwie zmienne, grupując je w pary. W poniższym przykładzie rozważymy trzy zmienne i narysujemy macierz wykresów punktowych. Otrzymujemy 3 pary wynikowej macierzy.
Przykład
PROC sgscatter DATA = CARS1;
matrix horsepower invoice length
/ group = type;
title 'Horsepower vs. Invoice vs. Length for car makers by types';
RUN;
Kiedy wykonujemy powyższy kod, otrzymujemy następujący wynik -