SAP HANA - modelarz informacji
SAP HANA Information Modeler; znany również jako HANA Data Modeler jest sercem HANA System. Umożliwia tworzenie widoków modelowania u góry tabel bazy danych i implementację logiki biznesowej w celu stworzenia sensownego raportu do analizy.
Funkcje narzędzia do modelowania informacji
Zapewnia wiele widoków danych transakcyjnych przechowywanych w fizycznych tabelach bazy danych HANA do celów analizy i logiki biznesowej.
Informacyjny program do modelowania działa tylko w przypadku tabel magazynowania opartych na kolumnach.
Widoki modelowania informacji są używane przez aplikacje oparte na języku Java lub HTML lub narzędzia SAP, takie jak SAP Lumira lub Analysis Office do celów raportowania.
Możliwe jest również użycie narzędzi innych firm, takich jak MS Excel, do połączenia z HANA i tworzenia raportów.
Widoki modelowania SAP HANA wykorzystują rzeczywistą moc SAP HANA.
Istnieją trzy typy widoków informacji, zdefiniowane jako -
- Widok atrybutów
- Widok analityczny
- Widok obliczeń
Sklep wiersz vs kolumna
Widoki SAP HANA Modeler można tworzyć tylko na górze tabel opartych na kolumnach. Przechowywanie danych w tabelach kolumnowych nie jest niczym nowym. Wcześniej zakładano, że przechowywanie danych w strukturze opartej na kolumnach zajmuje więcej pamięci i nie jest zoptymalizowane pod kątem wydajności.
Wraz z ewolucją SAP HANA, HANA użyła kolumnowego przechowywania danych w widokach informacji i przedstawiła rzeczywiste korzyści tabel kolumnowych w porównaniu z tabelami opartymi na wierszach.
Sklep kolumnowy
W tabeli magazynu kolumn dane są przechowywane w pionie. Tak więc podobne typy danych łączą się, jak pokazano w powyższym przykładzie. Zapewnia szybsze operacje odczytu i zapisu pamięci za pomocą In-Memory Computing Engine.
W konwencjonalnej bazie danych dane są przechowywane w strukturze opartej na wierszach, tj. Poziomo. SAP HANA przechowuje dane w strukturze opartej na wierszach i kolumnach. Zapewnia to optymalizację wydajności, elastyczność i kompresję danych w bazie danych HANA.
Przechowywanie danych w tabeli opartej na kolumnach ma następujące zalety -
Kompresja danych
Szybszy dostęp do odczytu i zapisu do tabel w porównaniu z konwencjonalną pamięcią opartą na wierszach
Elastyczność i przetwarzanie równoległe
Wykonuj agregacje i obliczenia z większą prędkością
Istnieje wiele metod i algorytmów przechowywania danych w strukturze opartej na kolumnach - skompresowany słownik, skompresowany długości przebiegu i wiele innych.
W skompresowanym słowniku komórki są przechowywane w postaci liczb w tabelach, a komórki liczbowe są zawsze zoptymalizowane pod kątem wydajności w porównaniu ze znakami.
W skompresowanej długości przebiegu zapisuje mnożnik z wartością komórki w formacie liczbowym, a mnożnik pokazuje powtarzalną wartość w tabeli.
Różnica funkcjonalna - magazyn wierszy a kolumna
Zawsze zaleca się korzystanie z pamięci opartej na kolumnach, jeśli instrukcja SQL ma wykonywać funkcje agregujące i obliczenia. Tabele oparte na kolumnach zawsze działają lepiej, gdy działają funkcje agregujące, takie jak Suma, Liczba, Maks.
Przechowywanie oparte na wierszach jest preferowane, gdy dane wyjściowe muszą zwracać cały wiersz. Poniższy przykład ułatwia zrozumienie.
W powyższym przykładzie, podczas uruchamiania funkcji Aggregate (Sum) w kolumnie sprzedaży z klauzulą Where, podczas wykonywania zapytania SQL będzie używana tylko kolumna Date and Sales, więc jeśli jest to tabela magazynu oparta na kolumnach, zostanie zoptymalizowana pod kątem wydajności, szybciej niż dane jest wymagane tylko z dwóch kolumn.
Podczas uruchamiania prostego zapytania wybierającego, na wyjściu musi zostać wydrukowany pełny wiersz, dlatego zaleca się przechowywanie tabeli jako wiersza opartego na tym scenariuszu.
Widoki modelowania informacji
Widok atrybutów
Atrybuty są niemierzalnymi elementami w tabeli bazy danych. Reprezentują dane podstawowe i są podobne do cech BW. Widoki atrybutów są wymiarami w bazie danych lub są używane do łączenia wymiarów lub innych widoków atrybutów w modelowaniu.
Ważne cechy to -
- Widoki atrybutów są używane w widokach analitycznych i obliczeniowych.
- Widok atrybutów reprezentuje dane podstawowe.
- Służy do filtrowania rozmiaru tabel wymiarów w widoku analitycznym i obliczeniowym.
Widok analityczny
Widoki analityczne wykorzystują moc SAP HANA do wykonywania obliczeń i funkcji agregacji w tabelach w bazie danych. Zawiera co najmniej jedną tabelę faktów, która zawiera miary i klucze podstawowe tabel wymiarów i otoczona tabelami wymiarów, zawiera dane podstawowe.
Ważne cechy to -
Widoki analityczne są przeznaczone do wykonywania zapytań o schemat gwiazdy.
Widoki analityczne zawierają co najmniej jedną tabelę faktów i tabele wielu wymiarów z danymi podstawowymi oraz umożliwiają wykonywanie obliczeń i agregacji
Są podobne do modułów informacyjnych i obiektów informacyjnych w SAP BW.
Widoki analityczne można tworzyć na podstawie widoków atrybutów i tabel faktów i wykonywać obliczenia, takie jak liczba sprzedanych jednostek, łączna cena itp.
Widoki obliczeniowe
Widoki obliczeń są używane na wierzchu widoków analitycznych i atrybutów w celu wykonywania złożonych obliczeń, które nie są możliwe w przypadku widoków analitycznych. Widok obliczeń to połączenie tabel bazowych kolumn, widoków atrybutów i widoków analitycznych w celu zapewnienia logiki biznesowej.
Ważne cechy to -
Widoki obliczeń są definiowane graficznie za pomocą funkcji modelowania HANA lub za pomocą skryptów w języku SQL.
Jest tworzony do wykonywania skomplikowanych obliczeń, które nie są możliwe w przypadku innych widoków - widoków atrybutów i analitycznych modelera SAP HANA.
Jeden lub więcej widoków atrybutów i widoków analitycznych jest używanych za pomocą wbudowanych funkcji, takich jak projekty, suma, łączenie, ranga w widoku obliczeń.