ETL-Tests - Szenarien

ETL-Testszenarien werden verwendet, um einen ETL-Testprozess zu validieren. In der folgenden Tabelle werden einige der häufigsten Szenarien und Testfälle erläutert, die von ETL-Testern verwendet werden.

Testszenarien Testfälle

Strukturvalidierung

Dabei werden die Quell- und die Zieltabellenstruktur gemäß dem Zuordnungsdokument überprüft.

Der Datentyp sollte im Quell- und im Zielsystem validiert werden.

Die Länge der Datentypen im Quell- und Zielsystem sollte gleich sein.

Datenfeldtypen und ihr Format sollten im Quell- und im Zielsystem identisch sein.

Überprüfen der Spaltennamen im Zielsystem.

Zuordnungsdokument validieren

Dabei wird das Zuordnungsdokument validiert, um sicherzustellen, dass alle Informationen bereitgestellt wurden. Das Zuordnungsdokument sollte über ein Änderungsprotokoll verfügen, Datentypen, Länge, Transformationsregeln usw. beibehalten.

Einschränkungen validieren

Dazu müssen die Einschränkungen überprüft und sichergestellt werden, dass sie auf die erwarteten Tabellen angewendet werden.

Datenkonsistenzprüfung

Dabei wird der Missbrauch von Integritätsbeschränkungen wie Fremdschlüssel überprüft.

Die Länge und der Datentyp eines Attributs können in verschiedenen Tabellen variieren, obwohl ihre Definition auf der semantischen Ebene gleich bleibt.

Validierung der Datenvollständigkeit

Dabei wird überprüft, ob alle Daten vom Quellsystem in das Zielsystem geladen wurden.

Zählen der Anzahl der Datensätze im Quell- und im Zielsystem.

Grenzwertanalyse.

Überprüfen der eindeutigen Werte von Primärschlüsseln.

Validierung der Datenkorrektheit

Dabei werden die Datenwerte im Zielsystem überprüft.

Falsch geschriebene oder ungenaue Daten finden Sie in der Tabelle.

Null, nicht eindeutige Daten werden gespeichert, wenn Sie die Integritätsbeschränkung zum Zeitpunkt des Imports deaktivieren.

Validierung der Datentransformation

Dabei wird eine Tabelle mit Szenarien für Eingabewerte und erwartete Ergebnisse erstellt und anschließend mit den Endbenutzern validiert.

Überprüfen der Eltern-Kind-Beziehung in den Daten durch Erstellen von Szenarien.

Verwenden von Datenprofilen zum Vergleichen des Wertebereichs in jedem Feld.

Überprüfen, ob die Datentypen im Warehouse mit den im Datenmodell angegebenen übereinstimmen.

Validierung der Datenqualität

Es umfasst die Durchführung von Nummernprüfungen, Datumsprüfungen, Genauigkeitsprüfungen, Datenprüfungen, Nullprüfungen usw.

Example - Das Datumsformat sollte für alle Werte gleich sein.

Null-Validierung

Dabei werden die Nullwerte überprüft, bei denen für dieses Feld Not Null angegeben ist.

Doppelte Validierung

Dabei werden doppelte Werte im Zielsystem überprüft, wenn Daten aus mehreren Spalten des Quellsystems stammen.

Überprüfen von Primärschlüsseln und anderen Spalten, wenn gemäß den Geschäftsanforderungen doppelte Werte vorhanden sind.

Überprüfung der Datumsüberprüfung

Überprüfen des Datumsfelds für verschiedene Aktionen, die im ETL-Prozess ausgeführt werden.

Häufige Testfälle zur Durchführung der Datumsüberprüfung -

  • From_Date sollte nicht größer als To_Date sein

  • Das Format der Datumswerte sollte korrekt sein.

  • Datumswerte sollten keine Junk-Werte oder Nullwerte haben

Minus-Abfrage zur vollständigen Datenüberprüfung

Dabei wird der vollständige Datensatz in der Quell- und der Zieltabelle mithilfe der Minus-Abfrage überprüft.

  • Sie müssen beide ausführen source minus target und target minus source.

  • Wenn die Minus-Abfrage einen Wert zurückgibt, sollte dies als nicht übereinstimmende Zeilen betrachtet werden.

  • Sie müssen die Zeilen in Quelle und Ziel mit dem übereinstimmen Intersect Erklärung.

  • Die von Intersect zurückgegebene Anzahl sollte mit den einzelnen Zählungen der Quell- und Zieltabellen übereinstimmen.

  • Wenn die Minus-Abfrage keine Zeilen zurückgibt und die Anzahl der Schnittpunkte geringer ist als die Anzahl der Quellen oder der Zieltabelle, enthält die Tabelle doppelte Zeilen.

Andere Testszenarien

Andere Testszenarien können darin bestehen, zu überprüfen, ob beim Extraktionsprozess keine doppelten Daten aus dem Quellsystem extrahiert wurden.

Das Testteam führt eine Liste der SQL-Anweisungen, die ausgeführt werden, um zu überprüfen, ob keine doppelten Daten aus den Quellsystemen extrahiert wurden.

Datenreinigung

Unerwünschte Daten sollten entfernt werden, bevor die Daten in den Staging-Bereich geladen werden.