SAS - ค่าเบี่ยงเบนมาตรฐาน
Standard Deviation (SD) คือการวัดความแตกต่างของข้อมูลในชุดข้อมูล ในทางคณิตศาสตร์จะวัดว่าค่าแต่ละค่าอยู่ห่างไกลหรือใกล้เพียงใดกับค่าเฉลี่ยของชุดข้อมูล ค่าเบี่ยงเบนมาตรฐานที่ใกล้ 0 แสดงว่าจุดข้อมูลมีแนวโน้มที่จะใกล้เคียงกับค่าเฉลี่ยของชุดข้อมูลมากและค่าเบี่ยงเบนมาตรฐานสูงบ่งชี้ว่าจุดข้อมูลกระจายออกไปในช่วงค่าที่กว้างขึ้น
ใน SAS ค่า SD จะถูกวัดโดยใช้ PROC MEAN และ PROC SURVEYMEANS
การใช้ PROC หมายถึง
ในการวัด SD โดยใช้ proc meansเราเลือกตัวเลือก STD ในขั้นตอน PROC จะนำเอาค่า SD สำหรับตัวแปรตัวเลขแต่ละตัวที่มีอยู่ในชุดข้อมูล
ไวยากรณ์
ไวยากรณ์พื้นฐานสำหรับการคำนวณค่าเบี่ยงเบนมาตรฐานใน SAS คือ -
PROC means DATA = dataset STD;
ต่อไปนี้เป็นคำอธิบายของพารามิเตอร์ที่ใช้ -
Dataset - คือชื่อของชุดข้อมูล
ตัวอย่าง
ในตัวอย่างด้านล่างเราสร้างชุดข้อมูล CARS1 จากชุดข้อมูล CARS ในไลบรารี SASHELP เราเลือกตัวเลือก STD ด้วยขั้นตอนวิธีการ PROC
PROC SQL;
create table CARS1 as
SELECT make, type, invoice, horsepower, length, weight
FROM
SASHELP.CARS
WHERE make in ('Audi','BMW')
;
RUN;
proc means data = CARS1 STD;
run;
เมื่อเรารันโค้ดด้านบนจะให้ผลลัพธ์ดังต่อไปนี้ -
การใช้ PROC SURVEYMEANS
ขั้นตอนนี้ยังใช้สำหรับการวัด SD พร้อมกับคุณสมบัติขั้นสูงบางอย่างเช่นการวัด SD สำหรับตัวแปรตามหมวดหมู่รวมถึงการประมาณการความแปรปรวน
ไวยากรณ์
ไวยากรณ์สำหรับการใช้ PROC SURVEYMEANS คือ -
PROC SURVEYMEANS options statistic-keywords ;
BY variables ;
CLASS variables ;
VAR variables ;
ต่อไปนี้เป็นคำอธิบายของพารามิเตอร์ที่ใช้ -
BY - ระบุตัวแปรที่ใช้ในการสร้างกลุ่มการสังเกต
CLASS - ระบุตัวแปรที่ใช้สำหรับตัวแปรจัดหมวดหมู่
VAR - ระบุตัวแปรที่จะคำนวณ SD
ตัวอย่าง
ตัวอย่างด้านล่างอธิบายการใช้งาน class ตัวเลือกที่สร้างสถิติสำหรับแต่ละค่าในตัวแปรคลาส
proc surveymeans data = CARS1 STD;
class type;
var type horsepower;
ods output statistics = rectangle;
run;
proc print data = rectangle;
run;
เมื่อเรารันโค้ดด้านบนจะให้ผลลัพธ์ดังต่อไปนี้ -
ใช้ตัวเลือก BY
โค้ดด้านล่างนี้เป็นตัวอย่างของตัวเลือก BY ผลลัพธ์จะถูกจัดกลุ่มสำหรับแต่ละค่าในตัวเลือก BY
ตัวอย่าง
proc surveymeans data = CARS1 STD;
var horsepower;
BY make;
ods output statistics = rectangle;
run;
proc print data = rectangle;
run;
เมื่อเรารันโค้ดด้านบนจะให้ผลลัพธ์ดังต่อไปนี้ -