DW - typy

Istnieją cztery typy systemów hurtowni danych.

  • Data Mart
  • Przetwarzanie analityczne online (OLAP)
  • Przetwarzanie transakcyjne online (OLTP)
  • Analiza predykcyjna (PA)

Data Mart

Data Mart jest znany jako najprostsza forma systemu hurtowni danych i zwykle składa się z pojedynczego obszaru funkcjonalnego w organizacji, takiego jak sprzedaż, finanse lub marketing itp.

Data Mart w organizacji jest tworzony i zarządzany przez jeden dział. Ponieważ należy do jednego działu, zwykle pobiera dane tylko z kilku lub jednego typu źródeł / aplikacji. Źródłem tym może być wewnętrzny system operacyjny, hurtownia danych lub system zewnętrzny.

Przetwarzanie analityczne online

W systemie OLAP liczba transakcji jest mniejsza niż w systemie transakcyjnym. Wykonywane zapytania mają złożony charakter i obejmują agregacje danych.

Co to jest agregacja?

Zapisujemy tabele z zagregowanymi danymi, takimi jak roczne (1 wiersz), kwartalne (4 wiersze), miesięczne (12 wierszy) lub tak dalej, jeśli ktoś musi robić porównanie rok do roku, przetworzony zostanie tylko jeden wiersz. Jednak w niezagregowanej tabeli będzie porównywać wszystkie wiersze.

SELECT SUM(salary)
FROM employee
WHERE title = 'Programmer';

Skuteczne środki w systemie OLAP

Czas odpowiedzi jest uważany za jeden z najbardziej skutecznych i kluczowych mierników w OLAPsystem. Zagregowane przechowywane dane są utrzymywane w wielowymiarowych schematach, takich jak schematy gwiaździste (gdy dane są uporządkowane w hierarchiczne grupy, często nazywane wymiarami, oraz w fakty i zagregowane fakty, nazywa się to Schematami).

Opóźnienie systemu OLAP wynosi kilka godzin w porównaniu z bazami danych, w przypadku których oczekuje się, że opóźnienie jest zbliżone do jednego dnia.

Przetwarzanie transakcji online

W systemie OLTP istnieje wiele krótkich transakcji online, takich jak INSERT, UPDATE i DELETE.

W systemie OLTP skuteczną miarą jest czas przetwarzania krótkich transakcji i jest on znacznie krótszy. Kontroluje integralność danych w środowiskach z wieloma dostępami. W przypadku systemu OLTP liczba transakcji na sekundę mierzyeffectiveness. System hurtowni danych OLTP zawiera aktualne i szczegółowe dane i jest utrzymywany w schematach w modelu encji (3NF).

Przykład

Codzienny system transakcyjny w sklepie detalicznym, w którym zapisy klientów są codziennie wprowadzane, aktualizowane i usuwane. Zapewnia bardzo szybkie przetwarzanie zapytań. Bazy danych OLTP zawierają szczegółowe i aktualne dane. Schemat używany do przechowywania bazy danych OLTP to model jednostki.

Różnice między OLTP i OLAP

Na poniższych ilustracjach przedstawiono kluczowe różnice między OLTP i OLAP system.

  • Indexes - System OLTP ma tylko kilka indeksów, podczas gdy w systemie OLAP istnieje wiele indeksów do optymalizacji wydajności.

  • Joins- W systemie OLTP duża liczba sprzężeń i danych jest znormalizowana. Jednak w systemie OLAP jest mniej połączeń i są one zdenormalizowane.

  • Aggregation - W systemie OLTP dane nie są agregowane, podczas gdy w bazie danych OLAP używanych jest więcej agregacji.

Analiza predykcyjna

Analiza predykcyjna jest znana jako znajdowanie ukrytych wzorców w danych przechowywanych w systemie DW przy użyciu różnych funkcji matematycznych do przewidywania przyszłych wyników.

System analizy predykcyjnej różni się od systemu OLAP sposobem jego wykorzystania. Służy do skupienia się na przyszłych wynikach. System OALP koncentruje się na przetwarzaniu danych bieżących i historycznych na potrzeby raportowania analitycznego.