SAS - Kutu Grafikleri

Kutu grafiği, sayısal veri gruplarının çeyrekleri boyunca grafiksel temsilidir. Kutu grafikleri ayrıca, üst ve alt çeyreklerin dışındaki değişkenliği gösteren kutulardan (bıyıklar) dikey olarak uzanan çizgilere sahip olabilir. Kutunun altı ve üstü her zaman birinci ve üçüncü çeyreklerdir ve kutunun içindeki şerit her zaman ikinci çeyrektir (medyan). SAS'da basit bir Boxplot oluşturulur.PROC SGPLOT ve panelli kutu grafiği kullanılarak oluşturulur PROC SGPANEL.

Lütfen ilk örnekte CARS1 adlı veri kümesini oluşturduğumuzu ve sonraki tüm veri kümeleri için aynı veri kümesini kullandığımızı unutmayın. Bu veri seti, SAS oturumunun sonuna kadar çalışma kitaplığında kalır.

Sözdizimi

SAS'da bir kutu grafiği oluşturmak için temel sözdizimi şudur:

PROC SGPLOT  DATA = DATASET;
   VBOX VARIABLE / category = VARIABLE;
RUN; 

PROC SGPANEL  DATA = DATASET;;
PANELBY VARIABLE;
   VBOX VARIABLE> / category = VARIABLE;
RUN;

Aşağıda kullanılan parametrelerin açıklaması verilmiştir -

  • DATASET - kullanılan veri kümesinin adıdır.

  • VARIABLE - Kutu grafiğini çizmek için kullanılan değerdir.

Basit Kutu Grafiği

Basit bir Kutu Çizelgesinde, veri kümesinden bir değişken ve bir kategori oluşturmak için başka bir değişken seçeriz. Birinci değişkenin değerleri, ikinci değişkendeki farklı değerlerin sayısı kadar çok sayıda grupta kategorize edilir.

Misal

Aşağıdaki örnekte ilk değişken olarak beygir gücü değişkenini seçiyoruz ve kategori değişkeni olarak yazıyoruz. Böylece, her araba türü için beygir gücü değerlerinin dağılımı için kutu grafikler elde ederiz.

PROC SQL;
create table CARS1 as
SELECT make, model, type, invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

PROC SGPLOT  DATA = CARS1;
   VBOX horsepower 
   / category = type;

   title 'Horsepower of cars by types';
RUN;

Yukarıdaki kodu çalıştırdığımızda aşağıdaki çıktıyı alıyoruz -

Dikey Panellerde Kutu Grafiği

Bir değişkenin Kutu Grafiklerini birçok dikey panele (sütun) bölebiliriz. Her panel, tüm kategorik değişkenler için kutu grafiklerini tutar. Ancak kutu grafikleri, grafiği birden çok panele bölen başka bir üçüncü değişken kullanılarak ayrıca gruplandırılır.

Misal

Aşağıdaki örnekte, 'make' değişkenini kullanarak grafiği panel haline getirdik. İki farklı 'make' değeri olduğundan, iki dikey panel elde ederiz.

PROC SGPANEL  DATA = CARS1;
PANELBY MAKE;
   VBOX horsepower   / category = type;

   title 'Horsepower of cars by types';
RUN;

Yukarıdaki kodu çalıştırdığımızda aşağıdaki çıktıyı alıyoruz -

Yatay Panellerde Kutu Grafiği

Bir değişkenin Kutu Grafiklerini birçok yatay panele (satırlara) bölebiliriz. Her panel, tüm kategorik değişkenler için kutu grafiklerini tutar. Ancak kutu grafikleri, grafiği birden çok panele bölen başka bir üçüncü değişken kullanılarak ayrıca gruplandırılır. Aşağıdaki örnekte, 'make' değişkenini kullanarak grafiği panel haline getirdik. İki farklı 'make' değeri olduğundan, iki yatay panel elde ederiz.

PROC SGPANEL  DATA = CARS1;
PANELBY MAKE / columns = 1 novarname;

   VBOX horsepower   / category = type;

   title 'Horsepower of cars by types';
RUN;

Yukarıdaki kodu çalıştırdığımızda aşağıdaki çıktıyı alıyoruz -