Data Warehousing - OLAP
Der Online Analytical Processing Server (OLAP) basiert auf dem mehrdimensionalen Datenmodell. Manager und Analysten erhalten durch schnellen, konsistenten und interaktiven Zugriff auf Informationen einen Einblick in die Informationen. Dieses Kapitel behandelt die OLAP-Typen, Operationen auf OLAP, den Unterschied zwischen OLAP sowie statistische Datenbanken und OLTP.
Arten von OLAP-Servern
Wir haben vier Arten von OLAP-Servern -
- Relationales OLAP (ROLAP)
- Mehrdimensionales OLAP (MOLAP)
- Hybrid-OLAP (HOLAP)
- Spezialisierte SQL Server
Relationales OLAP
ROLAP-Server werden zwischen relationalen Back-End-Servern und Client-Front-End-Tools platziert. Zum Speichern und Verwalten von Lagerdaten verwendet ROLAP relationales oder erweitertes relationales DBMS.
ROLAP umfasst Folgendes:
- Implementierung der Aggregationsnavigationslogik.
- Optimierung für jedes DBMS-Backend.
- Zusätzliche Tools und Services.
Mehrdimensionales OLAP
MOLAP verwendet Array-basierte mehrdimensionale Speicher-Engines für mehrdimensionale Ansichten von Daten. Bei mehrdimensionalen Datenspeichern kann die Speichernutzung gering sein, wenn der Datensatz dünn ist. Daher verwenden viele MOLAP-Server zwei Ebenen der Datenspeicherdarstellung, um dichte und spärliche Datensätze zu verarbeiten.
Hybrid-OLAP
Hybrid-OLAP ist eine Kombination aus ROLAP und MOLAP. Es bietet eine höhere Skalierbarkeit von ROLAP und eine schnellere Berechnung von MOLAP. Auf HOLAP-Servern können große Datenmengen detaillierter Informationen gespeichert werden. Die Aggregationen werden separat im MOLAP-Speicher gespeichert.
Spezialisierte SQL Server
Spezialisierte SQL Server bieten erweiterte Unterstützung für Abfragesprache und Abfrageverarbeitung für SQL-Abfragen über Stern- und Schneeflockenschemata in einer schreibgeschützten Umgebung.
OLAP-Operationen
Da OLAP-Server auf einer mehrdimensionalen Ansicht von Daten basieren, werden wir OLAP-Operationen in mehrdimensionalen Daten diskutieren.
Hier ist die Liste der OLAP-Operationen -
- Roll-up
- Drill-down
- In Würfel schneiden
- Schwenken (drehen)
Aufrollen
Das Rollup führt eine Aggregation für einen Datenwürfel auf eine der folgenden Arten durch:
- Durch Aufsteigen einer Konzepthierarchie für eine Dimension
- Durch Dimensionsreduzierung
Das folgende Diagramm zeigt, wie das Rollup funktioniert.
Das Rollup wird durchgeführt, indem eine Konzepthierarchie für den Dimensionsort hochgeklettert wird.
Anfangs war die Konzepthierarchie "Straße <Stadt <Provinz <Land".
Beim Aufrollen werden die Daten aggregiert, indem die Standorthierarchie von der Ebene der Stadt auf die Ebene des Landes aufgestiegen wird.
Die Daten sind eher in Städte als in Länder gruppiert.
Beim Rollup werden eine oder mehrere Dimensionen aus dem Datenwürfel entfernt.
Aufreißen
Drilldown ist der umgekehrte Vorgang des Aufrollens. Es wird auf eine der folgenden Arten ausgeführt:
- Durch Herabsetzen einer Konzepthierarchie für eine Dimension
- Durch die Einführung einer neuen Dimension.
Das folgende Diagramm zeigt, wie ein Drilldown funktioniert -
Ein Drilldown wird durchgeführt, indem eine Konzepthierarchie für die Dimensionszeit herabgesetzt wird.
Anfangs war die Konzepthierarchie "Tag <Monat <Quartal <Jahr".
Beim Drilldown wird die Zeitdimension von der Ebene des Quartals auf die Ebene des Monats gesenkt.
Wenn ein Drilldown durchgeführt wird, werden eine oder mehrere Dimensionen aus dem Datenwürfel hinzugefügt.
Es navigiert die Daten von weniger detaillierten Daten zu sehr detaillierten Daten.
Scheibe
Die Slice-Operation wählt eine bestimmte Dimension aus einem bestimmten Cube aus und stellt einen neuen Unterwürfel bereit. Betrachten Sie das folgende Diagramm, das zeigt, wie Slice funktioniert.
Hier wird Slice für die Dimension "Zeit" unter Verwendung des Kriteriums Zeit = "Q1" durchgeführt.
Durch Auswahl einer oder mehrerer Dimensionen wird ein neuer Unterwürfel gebildet.
Würfel
Dice wählt zwei oder mehr Dimensionen aus einem bestimmten Würfel aus und stellt einen neuen Unterwürfel bereit. Betrachten Sie das folgende Diagramm, das die Würfeloperation zeigt.
Die Würfeloperation auf dem Würfel basierend auf den folgenden Auswahlkriterien umfasst drei Dimensionen.
- (Ort = "Toronto" oder "Vancouver")
- (Zeit = "Q1" oder "Q2")
- (item = "Mobil" oder "Modem")
Pivot
Die Schwenkoperation wird auch als Drehung bezeichnet. Es dreht die Datenachsen im Blick, um eine alternative Darstellung der Daten bereitzustellen. Betrachten Sie das folgende Diagramm, das die Schwenkoperation zeigt.
OLAP gegen OLTP
Sr.Nr. | Data Warehouse (OLAP) | Betriebsdatenbank (OLTP) |
---|---|---|
1 | Umfasst die historische Verarbeitung von Informationen. | Umfasst die tägliche Verarbeitung. |
2 | OLAP-Systeme werden von Wissensarbeitern wie Führungskräften, Managern und Analysten verwendet. | OLTP-Systeme werden von Angestellten, Datenbankadministratoren oder Datenbankfachleuten verwendet. |
3 | Nützlich bei der Analyse des Geschäfts. | Nützlich bei der Führung des Geschäfts. |
4 | Es konzentriert sich auf Information out. | Es konzentriert sich auf Daten in. |
5 | Basierend auf Sternschema, Schneeflocke, Schema und Faktenkonstellationsschema. | Basierend auf dem Entity Relationship Model. |
6 | Enthält historische Daten. | Enthält aktuelle Daten. |
7 | Bietet zusammengefasste und konsolidierte Daten. | Bietet primitive und sehr detaillierte Daten. |
8 | Bietet eine zusammengefasste und mehrdimensionale Ansicht der Daten. | Bietet eine detaillierte und flache relationale Ansicht der Daten. |
9 | Anzahl oder Benutzer ist in Hunderten. | Die Anzahl der Benutzer beträgt Tausende. |
10 | Die Anzahl der Datensätze, auf die zugegriffen wird, ist in Millionen. | Die Anzahl der Datensätze, auf die zugegriffen wird, ist in Zehnern. |
11 | Die Datenbankgröße beträgt 100 GB bis 1 TB | Die Datenbankgröße beträgt 100 MB bis 1 GB. |
12 | Sehr flexibel. | Bietet hohe Leistung. |