SAS - Streudiagramme

Ein Streudiagramm ist eine Art Diagramm, das Werte aus zwei Variablen verwendet, die in einer kartesischen Ebene dargestellt sind. Es wird normalerweise verwendet, um die Beziehung zwischen zwei Variablen herauszufinden. In SAS verwenden wirPROC SGSCATTER Streudiagramme erstellen.

Bitte beachten Sie, dass wir im ersten Beispiel den Datensatz CARS1 erstellen und für alle nachfolgenden Datensätze denselben Datensatz verwenden. Dieser Datensatz bleibt bis zum Ende der SAS-Sitzung in der Arbeitsbibliothek.

Syntax

Die grundlegende Syntax zum Erstellen eines Streudiagramms in SAS lautet:

PROC sgscatter  DATA = DATASET;
   PLOT VARIABLE_1 * VARIABLE_2
   / datalabel = VARIABLE group = VARIABLE;
RUN;

Es folgt die Beschreibung der verwendeten Parameter -

  • DATASET ist der Name des Datensatzes.

  • VARIABLE ist die aus dem Datensatz verwendete Variable.

Einfaches Streudiagramm

In einem einfachen Streudiagramm wählen wir zwei Variablen aus dem Datensatz aus und gruppieren sie in Bezug auf eine dritte Variable. Wir können die Daten auch beschriften. Das Ergebnis zeigt, wie die beiden Variablen in derCartesian plane.

Beispiel

PROC SQL;
create table CARS1 as
SELECT make, model, type, invoice, horsepower, length, weight
FROM 
SASHELP.CARS
WHERE make in ('Audi','BMW')
;
RUN;

TITLE 'Scatterplot - Two Variables';
PROC sgscatter  DATA = CARS1;
   PLOT horsepower*Invoice 
   / datalabel = make group = type grid;
   title 'Horsepower vs. Invoice for car makers by types';
RUN;

Wenn wir den obigen Code ausführen, erhalten wir die folgende Ausgabe:

Streudiagramm mit Vorhersage

Wir können einen Schätzparameter verwenden, um die Stärke der Korrelation zwischen vorherzusagen, indem wir eine Ellipse um die Werte zeichnen. Wir verwenden die zusätzlichen Optionen in der Prozedur, um die Ellipse wie unten gezeigt zu zeichnen.

Beispiel

proc sgscatter data = cars1; 
compare y = Invoice  x = (horsepower length)  
         / group = type  ellipse =(alpha = 0.05 type = predicted); 
title
'Average Invoice vs. horsepower for cars by length'; 
title2
'-- with 95% prediction ellipse --'
; 
format
Invoice dollar6.0;
run;

Wenn wir den obigen Code ausführen, erhalten wir die folgende Ausgabe:

Streumatrix

Wir können auch ein Streudiagramm mit mehr als zwei Variablen erstellen, indem wir sie in Paare gruppieren. Im folgenden Beispiel betrachten wir drei Variablen und zeichnen eine Streudiagrammmatrix. Wir erhalten 3 Paare der resultierenden Matrix.

Beispiel

PROC sgscatter  DATA = CARS1;
   matrix horsepower invoice length
   / group = type;

   title 'Horsepower vs. Invoice vs. Length for car makers by types';
RUN;

Wenn wir den obigen Code ausführen, erhalten wir die folgende Ausgabe: