SAS - Frekans Dağılımları

Sıklık dağılımı, bir veri kümesindeki veri noktalarının sıklığını gösteren bir tablodur. Tablodaki her giriş, belirli bir grup veya aralık içindeki değerlerin oluşumlarının sıklığını veya sayısını içerir ve bu şekilde tablo, örnekteki değerlerin dağılımını özetler.

SAS, PROC FREQ bir veri kümesindeki veri noktalarının frekans dağılımını hesaplamak için.

Sözdizimi

SAS'da frekans dağılımını hesaplamak için temel sözdizimi şudur:

PROC FREQ DATA = Dataset ;
TABLES Variable_1 ;
BY Variable_2 ;

Kullanılan parametrelerin açıklaması aşağıdadır -

  • Dataset veri kümesinin adıdır.

  • Variables_1 frekans dağılımı hesaplanması gereken veri kümesinin değişken isimleridir.

  • Variables_2 frekans dağılımı sonucunu kategorize eden değişkenlerdir.

Tek Değişkenli Frekans Dağılımı

Tek bir değişkenin frekans dağılımını kullanarak belirleyebiliriz PROC FREQ.Bu durumda sonuç, değişkenin her bir değerinin sıklığını gösterecektir. Sonuç ayrıca yüzde dağılımını, kümülatif sıklığı ve kümülatif yüzdeyi gösterir.

Misal

Aşağıdaki örnekte, adlı veri kümesi için değişken beygir gücünün frekans dağılımını buluyoruz. CARS1 kütüphaneden oluşturulan SASHELP.CARS.Sonucu iki sonuç kategorisine ayrılmış olarak görebiliriz. Arabanın her markası için bir tane.

PROC SQL;
create table CARS1 as
SELECT make, model, type, invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc FREQ data = CARS1 ;
tables horsepower; 
by make;
run;

Yukarıdaki kod çalıştırıldığında, aşağıdaki sonucu alıyoruz -

Çoklu Değişken Frekans Dağılımı

Birden çok değişken için, onları tüm olası kombinasyonlara gruplayan frekans dağılımlarını bulabiliriz.

Misal

Aşağıdaki örnekte, bir arabanın markası için frekans dağılımını hesaplıyoruz: grouped by car type ve ayrıca her araba türünün frekans dağılımı grouped by each make.

proc FREQ data = CARS1 ;
tables make type; 
run;

Yukarıdaki kod çalıştırıldığında, aşağıdaki sonucu alıyoruz -

Ağırlıklı Frekans Dağılımı

Ağırlık seçeneği ile değişkenin ağırlığına bağlı olarak frekans dağılımını hesaplayabiliriz. Burada değişkenin değeri, değer sayısı yerine gözlem sayısı olarak alınır.

Misal

Aşağıdaki örnekte, beygir gücüne atanan ağırlık ile marka ve tip değişkenlerinin frekans dağılımını hesaplıyoruz.

proc FREQ data = CARS1 ;
tables make type; 
weight horsepower;
run;

Yukarıdaki kod çalıştırıldığında, aşağıdaki sonucu alıyoruz -