SAS - Regressione lineare

La regressione lineare viene utilizzata per identificare la relazione tra una variabile dipendente e una o più variabili indipendenti. Viene proposto un modello della relazione e vengono utilizzate stime dei valori dei parametri per sviluppare un'equazione di regressione stimata.

Vengono quindi utilizzati vari test per determinare se il modello è soddisfacente. In tal caso, l'equazione di regressione stimata può essere utilizzata per prevedere il valore della variabile dipendente dati i valori per le variabili indipendenti. In SAS la proceduraPROC REG viene utilizzato per trovare il modello di regressione lineare tra due variabili.

Sintassi

La sintassi di base per applicare PROC REG in SAS è:

PROC REG DATA = dataset;
MODEL variable_1 = variable_2;

Di seguito la descrizione dei parametri utilizzati:

  • Dataset è il nome del set di dati.

  • variable_1 and variable_2 sono i nomi delle variabili del set di dati utilizzati per trovare la correlazione.

Esempio

L'esempio seguente mostra il processo per trovare la correlazione tra le due variabili potenza e peso di un'auto utilizzando PROC REG. Nel risultato vediamo i valori di intercetta che possono essere usati per formare l'equazione di regressione.

PROC SQL;
create table CARS1 as
SELECT invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;
proc reg data = cars1;
model horsepower = weight ;
run;

Quando il codice sopra viene eseguito, otteniamo il seguente risultato:

Il codice sopra fornisce anche la visualizzazione grafica di varie stime del modello come mostrato di seguito. Essendo una procedura SAS avanzata, semplicemente non si ferma a dare i valori di intercettazione come output.