SAS - Tabulasi Silang

Tabulasi silang melibatkan pembuatan tabel silang yang juga disebut tabel kontingen menggunakan semua kemungkinan kombinasi dari dua atau lebih variabel. Di SAS itu dibuat menggunakanPROC FREQ Bersama dengan TABLESpilihan. Misalnya - jika kita membutuhkan frekuensi setiap model untuk setiap merek di setiap kategori jenis mobil, maka kita perlu menggunakan opsi TABEL dari PROC FREQ.

Sintaksis

Sintaks dasar untuk menerapkan tabulasi silang di SAS adalah -

PROC FREQ DATA = dataset;
TABLES variable_1*Variable_2;

Berikut adalah deskripsi parameter yang digunakan -

  • Dataset adalah nama kumpulan data.

  • Variable_1 and Variable_2 adalah nama variabel dari kumpulan data yang distribusi frekuensinya perlu dihitung.

Contoh

Pertimbangkan kasus menemukan berapa banyak jenis mobil yang tersedia di bawah setiap merek mobil dari dataset mobil1 yang dibuat formulir SASHELP.CARSseperti gambar dibawah. Dalam hal ini kita membutuhkan nilai frekuensi individu serta jumlah nilai frekuensi di seluruh merek dan jenis. Kita dapat mengamati bahwa hasilnya menunjukkan nilai-nilai di seluruh baris dan kolom.

PROC SQL;
create table CARS1 as
SELECT make, type, invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc FREQ data = CARS1;
tables make*type; 
run;

Ketika kode di atas dijalankan, kita mendapatkan hasil sebagai berikut -

Tabulasi silang dari 3 Variabel

Ketika kita memiliki tiga variabel, kita dapat mengelompokkan 2 di antaranya dan membuat tabulasi silang masing-masing dari keduanya dengan variabel ketiga. Jadi hasilnya kami memiliki dua tabel silang.

Contoh

Dalam contoh di bawah ini, kami menemukan frekuensi setiap jenis mobil dan setiap model mobil sehubungan dengan merek mobilnya. Kami juga menggunakan opsi nocol dan norow untuk menghindari nilai jumlah dan persentase.

proc FREQ data = CARS2 ;
tables make * (type model)  / nocol norow nopercent;   
run;

Ketika kode di atas dijalankan, kita mendapatkan hasil sebagai berikut -

Tabulasi silang dari 4 Variabel

Dengan 4 variabel, jumlah kombinasi berpasangan meningkat menjadi 4. Setiap variabel dari kelompok 1 dipasangkan dengan setiap variabel dari kelompok 2.

Contoh

Dalam contoh di bawah ini kami menemukan frekuensi panjang mobil untuk setiap merek dan setiap model. Demikian pula frekuensi tenaga kuda untuk setiap merek dan setiap model.

proc FREQ data = CARS2 ;
tables (make model) * (length  horsepower)  / nocol norow nopercent;   
run;

Ketika kode di atas dijalankan, kita mendapatkan hasil sebagai berikut -