SAS - ฮิสโตแกรม

ฮิสโตแกรมคือการแสดงข้อมูลแบบกราฟิกโดยใช้แถบที่มีความสูงต่างกัน เป็นการจัดกลุ่มตัวเลขต่างๆในชุดข้อมูลออกเป็นหลายช่วง นอกจากนี้ยังแสดงถึงการประมาณความน่าจะเป็นของการแจกแจงของตัวแปรต่อเนื่อง ใน SAS thePROC UNIVARIATE ใช้ในการสร้างฮิสโทแกรมด้วยตัวเลือกด้านล่าง

ไวยากรณ์

ไวยากรณ์พื้นฐานในการสร้างฮิสโตแกรมใน SAS คือ -

PROC UNIVARAITE DATA = DATASET;
HISTOGRAM variables;
RUN;

ต่อไปนี้เป็นคำอธิบายของพารามิเตอร์ที่ใช้ -

  • DATASET คือชื่อของชุดข้อมูลที่ใช้

  • variables คือค่าที่ใช้ในการพล็อตฮิสโตแกรม

ฮิสโตแกรมอย่างง่าย

ฮิสโตแกรมอย่างง่ายถูกสร้างขึ้นโดยการระบุชื่อของตัวแปรและช่วงที่จะพิจารณาเพื่อจัดกลุ่มค่า

ตัวอย่าง

ในตัวอย่างด้านล่างเราจะพิจารณาค่าต่ำสุดและสูงสุดของแรงม้าตัวแปรและใช้ช่วง 50 ดังนั้นค่าจึงรวมกันเป็นกลุ่มในขั้นตอนที่ 50

proc univariate data = sashelp.cars;
   histogram horsepower
   / midpoints = 176 to 350 by 50;
run;

เมื่อเรารันโค้ดด้านบนเราจะได้ผลลัพธ์ดังต่อไปนี้ -

ฮิสโตแกรมพร้อม Curve Fitting

เราสามารถใส่เส้นโค้งการกระจายบางส่วนลงในฮิสโตแกรมได้โดยใช้ตัวเลือกเพิ่มเติม

ตัวอย่าง

ในตัวอย่างด้านล่างเราพอดีกับเส้นโค้งการแจกแจงที่มีค่าเฉลี่ยและค่าเบี่ยงเบนมาตรฐานที่กล่าวถึงเป็น EST ตัวเลือกนี้ใช้และประมาณค่าพารามิเตอร์

proc univariate data = sashelp.cars noprint;
histogram horsepower
/ 
normal ( 
   mu = est
   sigma = est
   color = blue
   w = 2.5 
)
barlabel = percent
midpoints = 70 to 550 by 50;
run;

เมื่อเรารันโค้ดด้านบนเราจะได้ผลลัพธ์ดังต่อไปนี้ -