Gudang Data - Skema

Skema didefinisikan sebagai deskripsi logis dari database di mana tabel fakta dan dimensi digabungkan secara logis. Data Warehouse dikelola dalam bentuk Star, Snow flakes, dan Fact Constellation schema.

Skema Bintang

Skema Bintang berisi tabel fakta dan tabel beberapa dimensi. Setiap dimensi diwakili dengan hanya tabel satu dimensi dan mereka tidak dinormalisasi. Tabel Dimensi berisi sekumpulan atribut.

Karakteristik

  • Dalam skema Bintang, hanya ada satu tabel fakta dan tabel beberapa dimensi.
  • Dalam skema Bintang, setiap dimensi diwakili oleh tabel satu dimensi.
  • Tabel dimensi tidak dinormalisasi dalam skema Bintang.
  • Setiap tabel Dimensi digabungkan ke sebuah kunci dalam tabel fakta.

Ilustrasi berikut memperlihatkan data penjualan suatu perusahaan terhadap empat dimensi yaitu Waktu, Barang, Cabang, dan Lokasi.

Ada tabel fakta di tengah. Ini berisi kunci untuk masing-masing dari empat dimensi. Tabel fakta juga memuat atribut yaitu dolar terjual dan unit terjual.

Note- Setiap dimensi hanya memiliki tabel satu dimensi dan setiap tabel memiliki sekumpulan atribut. Misalnya, tabel dimensi lokasi berisi kumpulan atribut {kunci_lokasi, jalan, kota, provinsi_atau_ negara, negara}. Batasan ini dapat menyebabkan redundansi data.

For example- "Vancouver" dan "Victoria" kedua kota tersebut berada di provinsi British Columbia, Kanada. Entri untuk kota-kota tersebut dapat menyebabkan redundansi data di sepanjang atribut provinsi_atau_negara dan negara.

Skema Kepingan Salju

Beberapa tabel dimensi dalam skema Kepingan Salju dinormalisasi. Normalisasi membagi data menjadi tabel tambahan seperti yang diperlihatkan dalam ilustrasi berikut.

Tidak seperti skema Bintang, tabel dimensi dalam skema kepingan salju dinormalisasi.

For example- Tabel dimensi item dalam skema bintang dinormalisasi dan dipecah menjadi tabel dua dimensi, yaitu tabel item dan tabel pemasok. Sekarang tabel dimensi item berisi atribut item_key, item_name, type, brand, dan supplier-key.

Kunci pemasok ditautkan ke tabel dimensi pemasok. Tabel dimensi pemasok berisi atribut supplier_key dan supplier_type.

Note - Karena normalisasi dalam skema Kepingan Salju, redundansi berkurang dan oleh karena itu, pemeliharaan dan penghematan ruang penyimpanan menjadi mudah.

Skema Konstelasi Fakta (Skema Galaksi)

Konstelasi fakta memiliki beberapa tabel fakta. Ia juga dikenal sebagai Skema Galaxy.

Ilustrasi berikut memperlihatkan dua tabel fakta, yaitu Sales dan Shipping -

Tabel fakta penjualan sama dengan yang ada di Skema Bintang. Tabel fakta pengiriman memiliki lima dimensi, yaitu item_key, time_key, shipper_key, from_location, to_location. Tabel fakta pengiriman juga memuat dua ukuran, yaitu dolar terjual dan unit terjual. Dimungkinkan juga untuk berbagi tabel dimensi di antara tabel fakta.

For example - Tabel dimensi waktu, item, dan lokasi dibagi antara tabel fakta penjualan dan pengiriman.