SAP HANA - Schemat w hurtowni danych
Schematy to logiczny opis tabel w hurtowni danych. Schematy są tworzone przez połączenie wielu tabel faktów i wymiarów w celu spełnienia pewnej logiki biznesowej.
Baza danych wykorzystuje model relacyjny do przechowywania danych. Jednak hurtownia danych używa schematów, które łączą wymiary i tabele faktów w celu spełnienia logiki biznesowej. Istnieją trzy typy schematów używanych w hurtowni danych -
- Schemat gwiazdy
- Schemat płatków śniegu
- Schemat galaktyki
Schemat gwiazdy
W schemacie gwiaździstym każdy wymiar jest łączony z jedną tabelą faktów. Każdy wymiar jest reprezentowany tylko przez jeden wymiar i nie podlega dalszej normalizacji.
Tabela wymiarów zawiera zestaw atrybutów używanych do analizy danych.
Example - W przykładzie podanym poniżej mamy tabelę faktów FactSales, która zawiera klucze podstawowe dla wszystkich tabel Dim i mierzy sprzedane jednostki i dolary_ do analizy.
Mamy cztery tabele wymiarów - DimTime, DimItem, DimBranch, DimLocation

Każda tabela wymiarów jest połączona z tabelą faktów, ponieważ tabela faktów ma klucz podstawowy dla każdej tabeli wymiarów używanej do łączenia dwóch tabel.
Fakty / miary w tabeli faktów są używane do celów analitycznych wraz z atrybutem w tabelach wymiarów.
Schemat płatków śniegu
W schemacie Płatki śniegu niektóre tabele wymiarów są dalej, znormalizowane, a tabele wymiarów są połączone z jedną tabelą faktów. Normalizacja służy do organizowania atrybutów i tabel bazy danych, aby zminimalizować nadmiarowość danych.
Normalizacja polega na podzieleniu tabeli na mniej nadmiarowe mniejsze tabele bez utraty jakichkolwiek informacji, a mniejsze tabele są łączone z tabelą wymiarów.

W powyższym przykładzie tabele wymiarów DimItem i DimLocation są znormalizowane bez utraty jakichkolwiek informacji. Nazywa się to schematem płatków śniegu, w którym tabele wymiarów są dalej znormalizowane do mniejszych tabel.
Schemat galaktyki
W schemacie Galaxy istnieje wiele tabel faktów i tabel wymiarów. Każda tabela faktów przechowuje klucze główne kilku tabel wymiarów i miar / faktów do przeprowadzenia analizy.

W powyższym przykładzie istnieją dwie tabele faktów FactSales, FactShipping i wiele tabel wymiarów połączonych z tabelami faktów. Każda tabela faktów zawiera klucz podstawowy do połączonych tabel Dim i miar / faktów do wykonania analizy.