SAS - Streudiagramme
Ein Streudiagramm ist eine Art Diagramm, das Werte aus zwei Variablen verwendet, die in einer kartesischen Ebene dargestellt sind. Es wird normalerweise verwendet, um die Beziehung zwischen zwei Variablen herauszufinden. In SAS verwenden wirPROC SGSCATTER Streudiagramme erstellen.
Bitte beachten Sie, dass wir im ersten Beispiel den Datensatz CARS1 erstellen und für alle nachfolgenden Datensätze denselben Datensatz verwenden. Dieser Datensatz bleibt bis zum Ende der SAS-Sitzung in der Arbeitsbibliothek.
Syntax
Die grundlegende Syntax zum Erstellen eines Streudiagramms in SAS lautet:
PROC sgscatter DATA = DATASET;
PLOT VARIABLE_1 * VARIABLE_2
/ datalabel = VARIABLE group = VARIABLE;
RUN;
Es folgt die Beschreibung der verwendeten Parameter -
DATASET ist der Name des Datensatzes.
VARIABLE ist die aus dem Datensatz verwendete Variable.
Einfaches Streudiagramm
In einem einfachen Streudiagramm wählen wir zwei Variablen aus dem Datensatz aus und gruppieren sie in Bezug auf eine dritte Variable. Wir können die Daten auch beschriften. Das Ergebnis zeigt, wie die beiden Variablen in derCartesian plane.
Beispiel
PROC SQL;
create table CARS1 as
SELECT make, model, type, invoice, horsepower, length, weight
FROM
SASHELP.CARS
WHERE make in ('Audi','BMW')
;
RUN;
TITLE 'Scatterplot - Two Variables';
PROC sgscatter DATA = CARS1;
PLOT horsepower*Invoice
/ datalabel = make group = type grid;
title 'Horsepower vs. Invoice for car makers by types';
RUN;
Wenn wir den obigen Code ausführen, erhalten wir die folgende Ausgabe:
Streudiagramm mit Vorhersage
Wir können einen Schätzparameter verwenden, um die Stärke der Korrelation zwischen vorherzusagen, indem wir eine Ellipse um die Werte zeichnen. Wir verwenden die zusätzlichen Optionen in der Prozedur, um die Ellipse wie unten gezeigt zu zeichnen.
Beispiel
proc sgscatter data = cars1;
compare y = Invoice x = (horsepower length)
/ group = type ellipse =(alpha = 0.05 type = predicted);
title
'Average Invoice vs. horsepower for cars by length';
title2
'-- with 95% prediction ellipse --'
;
format
Invoice dollar6.0;
run;
Wenn wir den obigen Code ausführen, erhalten wir die folgende Ausgabe:
Streumatrix
Wir können auch ein Streudiagramm mit mehr als zwei Variablen erstellen, indem wir sie in Paare gruppieren. Im folgenden Beispiel betrachten wir drei Variablen und zeichnen eine Streudiagrammmatrix. Wir erhalten 3 Paare der resultierenden Matrix.
Beispiel
PROC sgscatter DATA = CARS1;
matrix horsepower invoice length
/ group = type;
title 'Horsepower vs. Invoice vs. Length for car makers by types';
RUN;
Wenn wir den obigen Code ausführen, erhalten wir die folgende Ausgabe: