Data Warehousing - OLAP

Der Online Analytical Processing Server (OLAP) basiert auf dem mehrdimensionalen Datenmodell. Manager und Analysten erhalten durch schnellen, konsistenten und interaktiven Zugriff auf Informationen einen Einblick in die Informationen. Dieses Kapitel behandelt die OLAP-Typen, Operationen auf OLAP, den Unterschied zwischen OLAP sowie statistische Datenbanken und OLTP.

Arten von OLAP-Servern

Wir haben vier Arten von OLAP-Servern -

  • Relationales OLAP (ROLAP)
  • Mehrdimensionales OLAP (MOLAP)
  • Hybrid-OLAP (HOLAP)
  • Spezialisierte SQL Server

Relationales OLAP

ROLAP-Server werden zwischen relationalen Back-End-Servern und Client-Front-End-Tools platziert. Zum Speichern und Verwalten von Lagerdaten verwendet ROLAP relationales oder erweitertes relationales DBMS.

ROLAP umfasst Folgendes:

  • Implementierung der Aggregationsnavigationslogik.
  • Optimierung für jedes DBMS-Backend.
  • Zusätzliche Tools und Services.

Mehrdimensionales OLAP

MOLAP verwendet Array-basierte mehrdimensionale Speicher-Engines für mehrdimensionale Ansichten von Daten. Bei mehrdimensionalen Datenspeichern kann die Speichernutzung gering sein, wenn der Datensatz dünn ist. Daher verwenden viele MOLAP-Server zwei Ebenen der Datenspeicherdarstellung, um dichte und spärliche Datensätze zu verarbeiten.

Hybrid-OLAP

Hybrid-OLAP ist eine Kombination aus ROLAP und MOLAP. Es bietet eine höhere Skalierbarkeit von ROLAP und eine schnellere Berechnung von MOLAP. Auf HOLAP-Servern können große Datenmengen detaillierter Informationen gespeichert werden. Die Aggregationen werden separat im MOLAP-Speicher gespeichert.

Spezialisierte SQL Server

Spezialisierte SQL Server bieten erweiterte Unterstützung für Abfragesprache und Abfrageverarbeitung für SQL-Abfragen über Stern- und Schneeflockenschemata in einer schreibgeschützten Umgebung.

OLAP-Operationen

Da OLAP-Server auf einer mehrdimensionalen Ansicht von Daten basieren, werden wir OLAP-Operationen in mehrdimensionalen Daten diskutieren.

Hier ist die Liste der OLAP-Operationen -

  • Roll-up
  • Drill-down
  • In Würfel schneiden
  • Schwenken (drehen)

Aufrollen

Das Rollup führt eine Aggregation für einen Datenwürfel auf eine der folgenden Arten durch:

  • Durch Aufsteigen einer Konzepthierarchie für eine Dimension
  • Durch Dimensionsreduzierung

Das folgende Diagramm zeigt, wie das Rollup funktioniert.

  • Das Rollup wird durchgeführt, indem eine Konzepthierarchie für den Dimensionsort hochgeklettert wird.

  • Anfangs war die Konzepthierarchie "Straße <Stadt <Provinz <Land".

  • Beim Aufrollen werden die Daten aggregiert, indem die Standorthierarchie von der Ebene der Stadt auf die Ebene des Landes aufgestiegen wird.

  • Die Daten sind eher in Städte als in Länder gruppiert.

  • Beim Rollup werden eine oder mehrere Dimensionen aus dem Datenwürfel entfernt.

Aufreißen

Drilldown ist der umgekehrte Vorgang des Aufrollens. Es wird auf eine der folgenden Arten ausgeführt:

  • Durch Herabsetzen einer Konzepthierarchie für eine Dimension
  • Durch die Einführung einer neuen Dimension.

Das folgende Diagramm zeigt, wie ein Drilldown funktioniert -

  • Ein Drilldown wird durchgeführt, indem eine Konzepthierarchie für die Dimensionszeit herabgesetzt wird.

  • Anfangs war die Konzepthierarchie "Tag <Monat <Quartal <Jahr".

  • Beim Drilldown wird die Zeitdimension von der Ebene des Quartals auf die Ebene des Monats gesenkt.

  • Wenn ein Drilldown durchgeführt wird, werden eine oder mehrere Dimensionen aus dem Datenwürfel hinzugefügt.

  • Es navigiert die Daten von weniger detaillierten Daten zu sehr detaillierten Daten.

Scheibe

Die Slice-Operation wählt eine bestimmte Dimension aus einem bestimmten Cube aus und stellt einen neuen Unterwürfel bereit. Betrachten Sie das folgende Diagramm, das zeigt, wie Slice funktioniert.

  • Hier wird Slice für die Dimension "Zeit" unter Verwendung des Kriteriums Zeit = "Q1" durchgeführt.

  • Durch Auswahl einer oder mehrerer Dimensionen wird ein neuer Unterwürfel gebildet.

Würfel

Dice wählt zwei oder mehr Dimensionen aus einem bestimmten Würfel aus und stellt einen neuen Unterwürfel bereit. Betrachten Sie das folgende Diagramm, das die Würfeloperation zeigt.

Die Würfeloperation auf dem Würfel basierend auf den folgenden Auswahlkriterien umfasst drei Dimensionen.

  • (Ort = "Toronto" oder "Vancouver")
  • (Zeit = "Q1" oder "Q2")
  • (item = "Mobil" oder "Modem")

Pivot

Die Schwenkoperation wird auch als Drehung bezeichnet. Es dreht die Datenachsen im Blick, um eine alternative Darstellung der Daten bereitzustellen. Betrachten Sie das folgende Diagramm, das die Schwenkoperation zeigt.

OLAP gegen OLTP

Sr.Nr. Data Warehouse (OLAP) Betriebsdatenbank (OLTP)
1 Umfasst die historische Verarbeitung von Informationen. Umfasst die tägliche Verarbeitung.
2 OLAP-Systeme werden von Wissensarbeitern wie Führungskräften, Managern und Analysten verwendet. OLTP-Systeme werden von Angestellten, Datenbankadministratoren oder Datenbankfachleuten verwendet.
3 Nützlich bei der Analyse des Geschäfts. Nützlich bei der Führung des Geschäfts.
4 Es konzentriert sich auf Information out. Es konzentriert sich auf Daten in.
5 Basierend auf Sternschema, Schneeflocke, Schema und Faktenkonstellationsschema. Basierend auf dem Entity Relationship Model.
6 Enthält historische Daten. Enthält aktuelle Daten.
7 Bietet zusammengefasste und konsolidierte Daten. Bietet primitive und sehr detaillierte Daten.
8 Bietet eine zusammengefasste und mehrdimensionale Ansicht der Daten. Bietet eine detaillierte und flache relationale Ansicht der Daten.
9 Anzahl oder Benutzer ist in Hunderten. Die Anzahl der Benutzer beträgt Tausende.
10 Die Anzahl der Datensätze, auf die zugegriffen wird, ist in Millionen. Die Anzahl der Datensätze, auf die zugegriffen wird, ist in Zehnern.
11 Die Datenbankgröße beträgt 100 GB bis 1 TB Die Datenbankgröße beträgt 100 MB bis 1 GB.
12 Sehr flexibel. Bietet hohe Leistung.