Data Warehousing - Terminologien

In diesem Kapitel werden einige der am häufigsten verwendeten Begriffe im Data Warehousing erläutert.

Metadaten

Metadaten werden einfach als Daten über Daten definiert. Die Daten, die zur Darstellung anderer Daten verwendet werden, werden als Metadaten bezeichnet. Beispielsweise dient der Index eines Buches als Metadaten für den Inhalt des Buches. Mit anderen Worten können wir sagen, dass Metadaten die zusammengefassten Daten sind, die uns zu den detaillierten Daten führen.

In Bezug auf Data Warehouse können wir Metadaten wie folgt definieren:

  • Metadaten sind eine Roadmap zum Data Warehouse.

  • Metadaten im Data Warehouse definieren die Warehouse-Objekte.

  • Metadaten fungieren als Verzeichnis. Dieses Verzeichnis hilft dem Entscheidungsunterstützungssystem, den Inhalt eines Data Warehouse zu finden.

Metadaten-Repository

Das Metadaten-Repository ist ein wesentlicher Bestandteil eines Data Warehouse-Systems. Es enthält die folgenden Metadaten -

  • Business metadata - Es enthält Informationen zum Dateneigentum, zur Geschäftsdefinition und zu Richtlinienänderungen.

  • Operational metadata- Es enthält die Währung der Daten und die Datenherkunft. Die Datenwährung bezieht sich auf die Daten, die aktiv, archiviert oder gelöscht sind. Datenherkunft bedeutet, dass der Verlauf der Daten migriert und die Transformation darauf angewendet wird.

  • Data for mapping from operational environment to data warehouse - Zu den Metadaten gehören Quelldatenbanken und deren Inhalte, Datenextraktion, Datenpartitionierung, Bereinigung, Transformationsregeln, Datenaktualisierungs- und Löschregeln.

  • The algorithms for summarization - Es enthält Dimensionsalgorithmen, Daten zur Granularität, Aggregation, Zusammenfassung usw.

Datenwürfel

Ein Datenwürfel hilft uns, Daten in mehreren Dimensionen darzustellen. Es wird durch Dimensionen und Fakten definiert. Die Dimensionen sind die Entitäten, für die ein Unternehmen die Aufzeichnungen aufbewahrt.

Abbildung des Datenwürfels

Angenommen, ein Unternehmen möchte mithilfe von Sales Data Warehouse Verkaufsaufzeichnungen in Bezug auf Zeit, Artikel, Filiale und Standort verfolgen. Diese Dimensionen ermöglichen es, den monatlichen Umsatz und die Filiale zu verfolgen, in der die Artikel verkauft wurden. Jeder Dimension ist eine Tabelle zugeordnet. Diese Tabelle wird als Dimensionstabelle bezeichnet. Beispielsweise kann die Dimensionstabelle "item" Attribute wie item_name, item_type und item_brand aufweisen.

Die folgende Tabelle zeigt die 2D-Ansicht der Verkaufsdaten für ein Unternehmen in Bezug auf Zeit-, Artikel- und Standortabmessungen.

Aber hier in dieser 2-D-Tabelle haben wir Aufzeichnungen nur in Bezug auf Zeit und Gegenstand. Die Verkäufe für Neu-Delhi werden in Bezug auf die Zeit und die Artikelabmessungen nach Art der verkauften Artikel angezeigt. Wenn wir die Verkaufsdaten mit einer weiteren Dimension anzeigen möchten, z. B. der Standortdimension, ist die 3D-Ansicht hilfreich. Die 3-D-Ansicht der Verkaufsdaten in Bezug auf Zeit, Artikel und Ort ist in der folgenden Tabelle dargestellt:

Die obige 3D-Tabelle kann wie in der folgenden Abbildung gezeigt als 3D-Datenwürfel dargestellt werden.

Datenmarkt

Data Marts enthalten eine Teilmenge organisationsweiter Daten, die für bestimmte Personengruppen in einer Organisation von Nutzen sind. Mit anderen Worten, ein Datamart enthält nur die Daten, die für eine bestimmte Gruppe spezifisch sind. Beispielsweise kann der Marketing Data Mart nur Daten enthalten, die sich auf Artikel, Kunden und Verkäufe beziehen. Data Marts sind auf Themen beschränkt.

Wichtige Punkte zu Data Marts

  • Windows-basierte oder Unix / Linux-basierte Server werden zum Implementieren von Data Marts verwendet. Sie sind auf kostengünstigen Servern implementiert.

  • Der Implementierungszyklus eines Data Mart wird in kurzen Zeiträumen gemessen, dh in Wochen statt in Monaten oder Jahren.

  • Der Lebenszyklus von Data Marts kann auf lange Sicht komplex sein, wenn ihre Planung und ihr Design nicht organisationsweit sind.

  • Data Marts sind klein.

  • Data Marts werden nach Abteilungen angepasst.

  • Die Quelle eines Data Mart ist ein abteilungsstrukturiertes Data Warehouse.

  • Data Marts sind flexibel.

Die folgende Abbildung zeigt eine grafische Darstellung von Data Marts.

Virtuelles Lager

Die Ansicht über ein betriebliches Data Warehouse wird als virtuelles Warehouse bezeichnet. Es ist einfach, ein virtuelles Lager zu erstellen. Der Aufbau eines virtuellen Lagers erfordert Überkapazitäten auf betriebsbereiten Datenbankservern.