SAS - Regressão Linear
A regressão linear é usada para identificar a relação entre uma variável dependente e uma ou mais variáveis independentes. Um modelo da relação é proposto, e estimativas dos valores dos parâmetros são usadas para desenvolver uma equação de regressão estimada.
Vários testes são então usados para determinar se o modelo é satisfatório. Se for então, a equação de regressão estimada pode ser usada para prever o valor dos valores dados da variável dependente para as variáveis independentes. No SAS o procedimentoPROC REG é usado para encontrar o modelo de regressão linear entre duas variáveis.
Sintaxe
A sintaxe básica para aplicar PROC REG no SAS é -
PROC REG DATA = dataset;
MODEL variable_1 = variable_2;
A seguir está a descrição dos parâmetros usados -
Dataset é o nome do conjunto de dados.
variable_1 and variable_2 são os nomes das variáveis do conjunto de dados usado para encontrar a correlação.
Exemplo
O exemplo a seguir mostra o processo para encontrar a correlação entre as duas variáveis de potência e peso de um carro usando PROC REG. No resultado, vemos os valores de interceptação que podem ser usados para formar a equação de regressão.
PROC SQL;
create table CARS1 as
SELECT invoice, horsepower, length, weight
FROM
SASHELP.CARS
WHERE make in ('Audi','BMW')
;
RUN;
proc reg data = cars1;
model horsepower = weight ;
run;
Quando o código acima é executado, obtemos o seguinte resultado -
O código acima também fornece uma visão gráfica de várias estimativas do modelo, conforme mostrado abaixo. Por ser um procedimento SAS avançado, ele simplesmente não para em fornecer os valores de interceptação como saída.