SAP HANA - Profil Data SQL
Tugas SQL Data Profiling digunakan untuk memahami dan menganalisis data dari berbagai sumber data. Ini digunakan untuk menghapus data yang salah, tidak lengkap dan mencegah masalah kualitas data sebelum dimuat di Data warehouse.
Berikut adalah manfaat tugas SQL Data Profiling -
Ini membantu menganalisis data sumber dengan lebih efektif.
Ini membantu dalam memahami data sumber dengan lebih baik.
Ini menghapus data yang salah, tidak lengkap dan meningkatkan kualitas data sebelum dimuat ke gudang Data.
Ini digunakan dengan tugas Ekstraksi, Transformasi dan Pemuatan.
Tugas Data Profiling memeriksa profil yang membantu memahami sumber data dan mengidentifikasi masalah pada data yang harus diperbaiki.
Anda dapat menggunakan tugas Profil Data di dalam paket Layanan Integrasi ke data profil yang disimpan di SQL Server dan untuk mengidentifikasi potensi masalah dengan kualitas data.
Note - Tugas Profil Data hanya berfungsi dengan sumber data SQL Server dan tidak mendukung sumber data berbasis file atau pihak ketiga lainnya.
Persyaratan Akses
Untuk menjalankan paket yang berisi tugas Data Profiling, akun pengguna harus memiliki izin baca / tulis dengan izin CREATE TABLE di database tempdb.
Penampil Profiler Data
Data Profile Viewer digunakan untuk meninjau keluaran profiler. Penampil Profil Data juga mendukung kemampuan penelusuran untuk membantu Anda memahami masalah kualitas data yang teridentifikasi dalam keluaran profil. Kemampuan lihat perincian ini mengirimkan kueri langsung ke sumber data asli.
Penyiapan dan Peninjauan Tugas Profil Data
Menyiapkan Tugas Profil Data
Ini melibatkan eksekusi paket yang berisi tugas Data Profiling untuk menghitung profil. Tugas menyimpan output dalam format XML ke file atau variabel paket.
Meninjau Profil
Untuk melihat profil data, kirim output ke file, lalu gunakan Penampil Profil Data. Penampil ini adalah utilitas yang berdiri sendiri yang menampilkan keluaran profil dalam format ringkasan dan detail dengan kemampuan penelusuran opsional.
Profil Data - Opsi Konfigurasi
Tugas Data Profiling memiliki opsi konfigurasi yang mudah ini -
Kolom karakter pengganti
Saat mengonfigurasi permintaan profil, tugas menerima karakter pengganti '*' sebagai pengganti nama kolom. Ini menyederhanakan konfigurasi dan memudahkan untuk menemukan karakteristik data yang tidak dikenal. Saat tugas berjalan, tugas profil setiap kolom yang memiliki tipe data yang sesuai.
Profil Cepat
Anda dapat memilih Profil Cepat untuk mengkonfigurasi tugas dengan cepat. Profil Cepat menampilkan tabel atau tampilan dengan menggunakan semua profil dan pengaturan default.
Tugas Profil Data dapat menghitung delapan profil data yang berbeda. Lima dari profil ini dapat memeriksa kolom individual dan tiga sisanya menganalisis- beberapa kolom atau hubungan antar kolom.
Profil Data - Keluaran Tugas
Tugas Data Profiling mengeluarkan profil yang dipilih ke dalam format XML yang terstruktur seperti skema DataProfile.xsd.
Anda dapat menyimpan salinan lokal skema dan melihat salinan lokal skema di Microsoft Visual Studio atau editor skema lain, di editor XML atau di editor teks seperti Notepad.