SAS - rozkłady częstotliwości

Rozkład częstotliwości to tabela pokazująca częstotliwość punktów danych w zbiorze danych. Każdy wpis w tabeli zawiera częstość lub liczbę wystąpień wartości w określonej grupie lub przedziale iw ten sposób tabela podsumowuje rozkład wartości w próbie.

SAS udostępnia procedurę o nazwie PROC FREQ do obliczenia rozkładu częstotliwości punktów danych w zbiorze danych.

Składnia

Podstawowa składnia do obliczania rozkładu częstotliwości w SAS to -

PROC FREQ DATA = Dataset ;
TABLES Variable_1 ;
BY Variable_2 ;

Poniżej znajduje się opis użytych parametrów -

  • Dataset to nazwa zbioru danych.

  • Variables_1 to nazwy zmiennych zbioru danych, którego rozkład częstotliwości ma zostać obliczony.

  • Variables_2 to zmienne, które klasyfikowały wynik rozkładu częstotliwości.

Rozkład pojedynczej zmiennej częstotliwości

Możemy określić rozkład częstotliwości pojedynczej zmiennej za pomocą PROC FREQ.W takim przypadku wynik pokaże częstotliwość każdej wartości zmiennej. Wynik pokazuje również rozkład procentowy, skumulowaną częstotliwość i skumulowany procent.

Przykład

W poniższym przykładzie znajdujemy rozkład częstotliwości zmiennej mocy dla nazwanego zbioru danych CARS1 który jest tworzony z biblioteki SASHELP.CARS.Widzimy wynik podzielony na dwie kategorie wyników. Po jednym dla każdej marki samochodu.

PROC SQL;
create table CARS1 as
SELECT make, model, type, invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc FREQ data = CARS1 ;
tables horsepower; 
by make;
run;

Po wykonaniu powyższego kodu otrzymujemy następujący wynik -

Rozkład wielu zmiennych częstotliwości

Możemy znaleźć rozkłady częstotliwości dla wielu zmiennych, które grupują je we wszystkie możliwe kombinacje.

Przykład

W poniższym przykładzie obliczamy rozkład częstotliwości dla marki samochodu dla grouped by car type a także rozkład częstotliwości każdego typu samochodu grouped by each make.

proc FREQ data = CARS1 ;
tables make type; 
run;

Po wykonaniu powyższego kodu otrzymujemy następujący wynik -

Rozkład częstotliwości z wagą

Dzięki opcji wagi możemy obliczyć rozkład częstotliwości obciążony wagą zmiennej. Tutaj wartość zmiennej jest przyjmowana jako liczba obserwacji, a nie liczba wartości.

Przykład

W poniższym przykładzie obliczamy rozkład częstotliwości marki i typu zmiennych z wagą przypisaną do mocy.

proc FREQ data = CARS1 ;
tables make type; 
weight horsepower;
run;

Po wykonaniu powyższego kodu otrzymujemy następujący wynik -