Hurtownia danych - schematy

Schemat jest definiowany jako logiczny opis bazy danych, w której tabele faktów i wymiarów są połączone w logiczny sposób. Hurtownia danych jest utrzymywana w postaci schematu Gwiazda, Płatki śniegu i Konstelacja faktów.

Schemat gwiazdy

Schemat gwiazdy zawiera tabelę faktów i tabele wielu wymiarów. Każdy wymiar jest reprezentowany za pomocą tylko jednej tabeli wymiarów i nie są one znormalizowane. Tabela wymiarów zawiera zestaw atrybutów.

Charakterystyka

  • W schemacie Star jest tylko jedna tabela faktów i wiele tabel wymiarów.
  • W schemacie Gwiazda każdy wymiar jest reprezentowany przez jednowymiarową tabelę.
  • Tabele wymiarów nie są znormalizowane w schemacie Star.
  • Każda tabela wymiarów jest połączona z kluczem w tabeli faktów.

Na poniższej ilustracji przedstawiono dane dotyczące sprzedaży firmy w odniesieniu do czterech wymiarów, a mianowicie czasu, pozycji, oddziału i lokalizacji.

Na środku znajduje się tabela faktów. Zawiera klucze do każdego z czterech wymiarów. Tabela faktów zawiera również atrybuty, a mianowicie sprzedane dolary i sprzedane jednostki.

Note- Każdy wymiar ma tylko jedną tabelę wymiarów, a każda tabela zawiera zestaw atrybutów. Na przykład tabela wymiarów lokalizacji zawiera zestaw atrybutów {klucz_lokalizacji, ulica, miasto, województwo_lub stan, kraj}. To ograniczenie może spowodować nadmiarowość danych.

For example- „Vancouver” i „Victoria”, oba miasta leżą w kanadyjskiej prowincji Kolumbia Brytyjska. Wpisy dla takich miast mogą spowodować redundancję danych wzdłuż atrybutów województwo_lub stan i kraj.

Schemat płatków śniegu

Niektóre tabele wymiarów w schemacie płatka śniegu są znormalizowane. Normalizacja dzieli dane na dodatkowe tabele, jak pokazano na poniższej ilustracji.

W przeciwieństwie do schematu Gwiazda, tabela wymiarów w schemacie płatka śniegu jest znormalizowana.

For example- Tabela wymiarów pozycji w schemacie gwiazdy jest znormalizowana i podzielona na dwie tabele wymiarów, a mianowicie tabelę pozycji i dostawców. Teraz tabela wymiarów pozycji zawiera atrybuty klucz_pozycji, nazwa_elementu, typ, markę i klucz dostawcy.

Klucz dostawcy jest powiązany z tabelą wymiarów dostawcy. Tabela wymiarów dostawcy zawiera atrybuty klucz_dostawcy i typ_dostawcy.

Note - Dzięki normalizacji w schemacie Snowflake redundancja jest zmniejszona, a tym samym staje się łatwa w utrzymaniu i oszczędza miejsce w pamięci.

Schemat konstelacji faktów (schemat galaktyki)

Konstelacja faktów ma wiele tabel faktów. Jest również znany jako schemat galaktyki.

Poniższa ilustracja przedstawia dwie tabele faktów, a mianowicie sprzedaż i wysyłkę -

Tabela faktów sprzedaży jest taka sama, jak w schemacie gwiazdy. Tabela faktów wysyłki ma pięć wymiarów, a mianowicie klucz_pozycji, klucz_czasu, klucz_wysyłki, from_location, to_location. Tabela faktów dotyczących wysyłki zawiera również dwie miary, a mianowicie sprzedane dolary i sprzedane jednostki. Możliwe jest również udostępnianie tabel wymiarów między tabelami faktów.

For example - Tabele wymiarów czasu, towarów i lokalizacji są wspólne dla tabeli faktów sprzedaży i wysyłki.