SAS - ค่าเบี่ยงเบนมาตรฐาน

Standard Deviation (SD) คือการวัดความแตกต่างของข้อมูลในชุดข้อมูล ในทางคณิตศาสตร์จะวัดว่าค่าแต่ละค่าอยู่ห่างไกลหรือใกล้เพียงใดกับค่าเฉลี่ยของชุดข้อมูล ค่าเบี่ยงเบนมาตรฐานที่ใกล้ 0 แสดงว่าจุดข้อมูลมีแนวโน้มที่จะใกล้เคียงกับค่าเฉลี่ยของชุดข้อมูลมากและค่าเบี่ยงเบนมาตรฐานสูงบ่งชี้ว่าจุดข้อมูลกระจายออกไปในช่วงค่าที่กว้างขึ้น

ใน SAS ค่า SD จะถูกวัดโดยใช้ PROC MEAN และ PROC SURVEYMEANS

การใช้ PROC หมายถึง

ในการวัด SD โดยใช้ proc meansเราเลือกตัวเลือก STD ในขั้นตอน PROC จะนำเอาค่า SD สำหรับตัวแปรตัวเลขแต่ละตัวที่มีอยู่ในชุดข้อมูล

ไวยากรณ์

ไวยากรณ์พื้นฐานสำหรับการคำนวณค่าเบี่ยงเบนมาตรฐานใน SAS คือ -

PROC means DATA = dataset STD;

ต่อไปนี้เป็นคำอธิบายของพารามิเตอร์ที่ใช้ -

  • Dataset - คือชื่อของชุดข้อมูล

ตัวอย่าง

ในตัวอย่างด้านล่างเราสร้างชุดข้อมูล CARS1 จากชุดข้อมูล CARS ในไลบรารี SASHELP เราเลือกตัวเลือก STD ด้วยขั้นตอนวิธีการ PROC

PROC SQL;
create table CARS1 as
SELECT make, type, invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc means data = CARS1 STD;
run;

เมื่อเรารันโค้ดด้านบนจะให้ผลลัพธ์ดังต่อไปนี้ -

การใช้ PROC SURVEYMEANS

ขั้นตอนนี้ยังใช้สำหรับการวัด SD พร้อมกับคุณสมบัติขั้นสูงบางอย่างเช่นการวัด SD สำหรับตัวแปรตามหมวดหมู่รวมถึงการประมาณการความแปรปรวน

ไวยากรณ์

ไวยากรณ์สำหรับการใช้ PROC SURVEYMEANS คือ -

PROC SURVEYMEANS options statistic-keywords ;
BY variables ;
CLASS variables ;
VAR variables ;

ต่อไปนี้เป็นคำอธิบายของพารามิเตอร์ที่ใช้ -

  • BY - ระบุตัวแปรที่ใช้ในการสร้างกลุ่มการสังเกต

  • CLASS - ระบุตัวแปรที่ใช้สำหรับตัวแปรจัดหมวดหมู่

  • VAR - ระบุตัวแปรที่จะคำนวณ SD

ตัวอย่าง

ตัวอย่างด้านล่างอธิบายการใช้งาน class ตัวเลือกที่สร้างสถิติสำหรับแต่ละค่าในตัวแปรคลาส

proc surveymeans data = CARS1 STD;
class type;
var type horsepower;
ods output statistics = rectangle;
run;
proc print data = rectangle;
run;

เมื่อเรารันโค้ดด้านบนจะให้ผลลัพธ์ดังต่อไปนี้ -

ใช้ตัวเลือก BY

โค้ดด้านล่างนี้เป็นตัวอย่างของตัวเลือก BY ผลลัพธ์จะถูกจัดกลุ่มสำหรับแต่ละค่าในตัวเลือก BY

ตัวอย่าง

proc surveymeans data = CARS1 STD;
var horsepower;
BY make;
ods output statistics = rectangle;
run;
proc print data = rectangle;
run;

เมื่อเรารันโค้ดด้านบนจะให้ผลลัพธ์ดังต่อไปนี้ -

ผลลัพธ์ของ make = "Audi"

ผลลัพธ์ของ make = "BMW"