SAS - Régression linéaire
La régression linéaire est utilisée pour identifier la relation entre une variable dépendante et une ou plusieurs variables indépendantes. Un modèle de la relation est proposé et des estimations des valeurs des paramètres sont utilisées pour développer une équation de régression estimée.
Différents tests sont ensuite utilisés pour déterminer si le modèle est satisfaisant. Si tel est le cas, l'équation de régression estimée peut être utilisée pour prédire la valeur de la variable dépendante des valeurs données pour les variables indépendantes. En SAS la procédurePROC REG est utilisé pour trouver le modèle de régression linéaire entre deux variables.
Syntaxe
La syntaxe de base pour appliquer PROC REG dans SAS est -
PROC REG DATA = dataset;
MODEL variable_1 = variable_2;
Voici la description des paramètres utilisés -
Dataset est le nom de l'ensemble de données.
variable_1 and variable_2 sont les noms de variables de l'ensemble de données utilisés pour trouver la corrélation.
Exemple
L'exemple ci-dessous montre le processus pour trouver la corrélation entre les deux variables puissance et poids d'une voiture en utilisant PROC REG. Dans le résultat, nous voyons les valeurs d'interception qui peuvent être utilisées pour former l'équation de régression.
PROC SQL;
create table CARS1 as
SELECT invoice, horsepower, length, weight
FROM
SASHELP.CARS
WHERE make in ('Audi','BMW')
;
RUN;
proc reg data = cars1;
model horsepower = weight ;
run;
Lorsque le code ci-dessus est exécuté, nous obtenons le résultat suivant -
Le code ci-dessus donne également la vue graphique de diverses estimations du modèle comme indiqué ci-dessous. Étant une procédure SAS avancée, elle ne s'arrête tout simplement pas à donner les valeurs d'interception comme sortie.