SAS - การถดถอยเชิงเส้น

Linear Regression ใช้เพื่อระบุความสัมพันธ์ระหว่างตัวแปรตามและตัวแปรอิสระหนึ่งตัวหรือมากกว่า มีการเสนอแบบจำลองของความสัมพันธ์และใช้การประมาณค่าพารามิเตอร์เพื่อพัฒนาสมการการถดถอยโดยประมาณ

จากนั้นจะใช้การทดสอบต่างๆเพื่อพิจารณาว่าแบบจำลองนั้นน่าพอใจหรือไม่ ถ้าเป็นเช่นนั้นสามารถใช้สมการการถดถอยโดยประมาณเพื่อทำนายค่าของตัวแปรตามค่าที่กำหนดสำหรับตัวแปรอิสระ ใน SAS ขั้นตอนPROC REG ใช้เพื่อค้นหาโมเดลการถดถอยเชิงเส้นระหว่างสองตัวแปร

ไวยากรณ์

ไวยากรณ์พื้นฐานสำหรับการใช้ PROC REG ใน SAS คือ -

PROC REG DATA = dataset;
MODEL variable_1 = variable_2;

ต่อไปนี้เป็นคำอธิบายของพารามิเตอร์ที่ใช้ -

  • Dataset คือชื่อของชุดข้อมูล

  • variable_1 and variable_2 คือชื่อตัวแปรของชุดข้อมูลที่ใช้ในการค้นหาความสัมพันธ์

ตัวอย่าง

ตัวอย่างด้านล่างแสดงขั้นตอนการค้นหาความสัมพันธ์ระหว่างสองตัวแปรแรงม้าและน้ำหนักของรถโดยใช้ PROC REG. ในผลลัพธ์เราจะเห็นค่าการสกัดกั้นซึ่งสามารถใช้ในการสร้างสมการการถดถอย

PROC SQL;
create table CARS1 as
SELECT invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;
proc reg data = cars1;
model horsepower = weight ;
run;

เมื่อดำเนินการโค้ดด้านบนเราจะได้ผลลัพธ์ดังต่อไปนี้ -

โค้ดด้านบนยังให้มุมมองแบบกราฟิกของค่าประมาณต่างๆของโมเดลดังที่แสดงด้านล่าง การเป็นโพรซีเดอร์ SAS ขั้นสูงมันไม่ได้หยุดอยู่แค่การให้ค่าการสกัดกั้นเป็นผลลัพธ์