SAS - regresja liniowa
Regresja liniowa służy do identyfikacji związku między zmienną zależną a co najmniej jedną zmienną niezależną. Zaproponowano model zależności, a oszacowania wartości parametrów posłużą do opracowania oszacowanego równania regresji.
Następnie stosuje się różne testy, aby określić, czy model jest zadowalający. Jeśli tak jest, oszacowane równanie regresji można wykorzystać do przewidywania wartości zmiennej zależnej podanych wartości dla zmiennych niezależnych. W SAS proceduraPROC REG służy do znalezienia modelu regresji liniowej między dwiema zmiennymi.
Składnia
Podstawowa składnia stosowania PROC REG w SAS to -
PROC REG DATA = dataset;
MODEL variable_1 = variable_2;
Poniżej znajduje się opis użytych parametrów -
Dataset to nazwa zbioru danych.
variable_1 and variable_2 są nazwami zmiennych zbioru danych użytymi do znalezienia korelacji.
Przykład
Poniższy przykład pokazuje proces znajdowania korelacji między dwiema zmiennymi moc i masą samochodu przy użyciu PROC REG. W rezultacie widzimy wartości przecięcia, które można wykorzystać do utworzenia równania regresji.
PROC SQL;
create table CARS1 as
SELECT invoice, horsepower, length, weight
FROM
SASHELP.CARS
WHERE make in ('Audi','BMW')
;
RUN;
proc reg data = cars1;
model horsepower = weight ;
run;
Po wykonaniu powyższego kodu otrzymujemy następujący wynik -
Powyższy kod daje również graficzny widok różnych oszacowań modelu, jak pokazano poniżej. Będąc zaawansowaną procedurą SAS, po prostu nie kończy się na podawaniu wartości przecięcia jako danych wyjściowych.