DW - przegląd
Hurtownia danych jest znana jako centralne repozytorium do przechowywania danych z jednego lub wielu heterogenicznych źródeł danych. Hurtownia danych służy do raportowania i analizowania informacji i przechowuje zarówno dane historyczne, jak i bieżące. Dane w systemie DW są wykorzystywane do raportowania analitycznego, które jest później wykorzystywane przez analityków biznesowych, kierowników sprzedaży lub pracowników wiedzy do podejmowania decyzji.
Dane w systemie DW są ładowane z operacyjnego systemu transakcyjnego, takiego jak Sprzedaż, Marketing, HR, SCM itp. Mogą przejść przez operacyjny magazyn danych lub inne transformacje, zanim zostaną załadowane do systemu DW w celu przetworzenia informacji.
Hurtownia danych - kluczowe funkcje
Kluczowe cechy systemu DW to -
Jest to centralne repozytorium danych, w którym dane są przechowywane z jednego lub większej liczby heterogenicznych źródeł danych.
System DW przechowuje zarówno dane bieżące, jak i historyczne. Zwykle system DW przechowuje dane historyczne z 5-10 lat.
System DW jest zawsze oddzielony od operacyjnego systemu transakcyjnego.
Dane w systemie DW są wykorzystywane do różnych rodzajów raportów analitycznych w zakresie od kwartalnych do rocznych porównań.
Potrzeba systemu DW
Załóżmy, że masz agencję zajmującą się pożyczkami mieszkaniowymi, w której dane pochodzą z wielu aplikacji, takich jak marketing, sprzedaż, ERP, HRM, MM itp. Te dane są wyodrębniane, przekształcane i ładowane do hurtowni danych.
Na przykład, jeśli musisz porównać kwartalną / roczną sprzedaż produktu, nie możesz użyć operacyjnej transakcyjnej bazy danych, ponieważ spowoduje to zawieszenie systemu transakcyjnego. Dlatego do tego celu używana jest hurtownia danych.
Różnica między DW i ODB
Różnice między hurtownią danych a operacyjną bazą danych (transakcyjną bazą danych) są następujące -
System transakcyjny jest przeznaczony do znanych obciążeń i transakcji, takich jak aktualizowanie rekordu użytkownika, wyszukiwanie rekordu itp. Jednak transakcje hurtowni danych są bardziej złożone i przedstawiają ogólną postać danych.
System transakcyjny zawiera bieżące dane organizacji, a hurtownia danych zwykle zawiera dane historyczne.
System transakcyjny obsługuje równoległe przetwarzanie wielu transakcji. Aby zachować spójność bazy danych, wymagane są mechanizmy kontroli współbieżności i odzyskiwania.
Zapytanie do operacyjnej bazy danych umożliwia odczytywanie i modyfikowanie operacji (usuwanie i aktualizowanie), podczas gdy zapytanie OLAP wymaga dostępu tylko do odczytu przechowywanych danych (instrukcja Select).
Architektura DW
Hurtownia danych obejmuje czyszczenie danych, integrację danych i konsolidację danych.
Hurtownia danych ma architekturę trójwarstwową - Data Source Layer, Integration Layer, i Presentation Layer. Powyższa ilustracja przedstawia wspólną architekturę systemu hurtowni danych.