SAP HANA - profilowanie danych SQL

Zadanie profilowania danych SQL służy do zrozumienia i analizy danych z wielu źródeł danych. Służy do usuwania nieprawidłowych, niekompletnych danych i zapobiegania problemom z jakością danych przed załadowaniem ich do Hurtowni danych.

Oto zalety zadań profilowania danych SQL -

  • Pomaga efektywniej analizować dane źródłowe.

  • Pomaga w lepszym zrozumieniu danych źródłowych.

  • Usuwa nieprawidłowe, niekompletne dane i poprawia jakość danych, zanim zostaną załadowane do hurtowni danych.

  • Jest używany z zadaniami ekstrakcji, transformacji i ładowania.

Zadanie Profilowanie danych sprawdza profile, które pomagają zrozumieć źródło danych i zidentyfikować problemy w danych, które należy naprawić.

Możesz użyć zadania Data Profiling w pakiecie Integration Services, aby profilować dane przechowywane w SQL Server i identyfikować potencjalne problemy z jakością danych.

Note - Zadanie profilowania danych działa tylko ze źródłami danych SQL Server i nie obsługuje żadnych innych źródeł danych opartych na plikach ani stron trzecich.

Wymaganie dostępu

Aby uruchomić pakiet zawierający zadanie profilowania danych, konto użytkownika musi mieć uprawnienia do odczytu / zapisu z uprawnieniami do tworzenia tabeli w bazie danych tempdb.

Przeglądarka Data Profiler

Przeglądarka profili danych służy do przeglądania danych wyjściowych programu profilującego. Przeglądarka profili danych obsługuje również możliwość przechodzenia do szczegółów, aby pomóc Ci zrozumieć problemy z jakością danych zidentyfikowane w danych wyjściowych profilu. Ta możliwość przechodzenia do szczegółów wysyła zapytania na żywo do oryginalnego źródła danych.

Konfiguracja i przeglądanie zadania profilowania danych

Konfigurowanie zadania profilowania danych

Obejmuje wykonanie pakietu zawierającego zadanie profilowania danych w celu obliczenia profili. Zadanie zapisuje dane wyjściowe w formacie XML do pliku lub zmiennej pakietu.

Przegląd profili

Aby wyświetlić profile danych, wyślij dane wyjściowe do pliku, a następnie użyj przeglądarki profili danych. Ta przeglądarka jest samodzielnym narzędziem wyświetlającym dane wyjściowe profilu w formacie podsumowania i szczegółów z opcjonalną możliwością przechodzenia do szczegółów.

Profilowanie danych - opcje konfiguracji

Zadanie profilowania danych ma te wygodne opcje konfiguracji -

Kolumny z symbolami wieloznacznymi

Podczas konfigurowania żądania profilu zadanie akceptuje symbol wieloznaczny „*” zamiast nazwy kolumny. Upraszcza to konfigurację i ułatwia odkrywanie cech nieznanych danych. Po uruchomieniu zadania zadanie profiluje każdą kolumnę, która ma odpowiedni typ danych.

Szybki profil

Możesz wybrać Szybki profil, aby szybko skonfigurować zadanie. Szybki profil profiluje tabelę lub widok przy użyciu wszystkich domyślnych profili i ustawień.

Zadanie profilowania danych może obliczyć osiem różnych profili danych. Pięć z tych profili może sprawdzać poszczególne kolumny, a pozostałe trzy analizować - wiele kolumn lub relacje między kolumnami.

Profilowanie danych - wyniki zadań

Zadanie Profilowanie danych wyprowadza wybrane profile do formatu XML, który ma strukturę podobną do schematu DataProfile.xsd.

Możesz zapisać lokalną kopię schematu i wyświetlić lokalną kopię schematu w programie Microsoft Visual Studio lub innym edytorze schematów, w edytorze XML lub w edytorze tekstu, takim jak Notatnik.