SAP HANA - Cấu hình dữ liệu SQL
Tác vụ SQL Data Profiling được sử dụng để hiểu và phân tích dữ liệu từ nhiều nguồn dữ liệu. Nó được sử dụng để loại bỏ dữ liệu không chính xác, không đầy đủ và ngăn chặn các vấn đề về chất lượng dữ liệu trước khi chúng được tải vào Kho dữ liệu.
Dưới đây là những lợi ích của các tác vụ Lập hồ sơ dữ liệu SQL -
Nó giúp phân tích dữ liệu nguồn hiệu quả hơn.
Nó giúp hiểu dữ liệu nguồn tốt hơn.
Nó loại bỏ dữ liệu không chính xác, không đầy đủ và cải thiện chất lượng dữ liệu trước khi nó được tải vào Kho dữ liệu.
Nó được sử dụng với nhiệm vụ Trích xuất, Chuyển đổi và Tải.
Tác vụ Lập hồ sơ dữ liệu kiểm tra các cấu hình giúp hiểu nguồn dữ liệu và xác định các vấn đề trong dữ liệu cần được khắc phục.
Bạn có thể sử dụng tác vụ Cấu hình dữ liệu bên trong gói Dịch vụ tích hợp để cấu hình dữ liệu được lưu trữ trong SQL Server và để xác định các vấn đề tiềm ẩn với chất lượng dữ liệu.
Note - Tác vụ lập hồ sơ dữ liệu chỉ hoạt động với các nguồn dữ liệu SQL Server và không hỗ trợ bất kỳ nguồn dữ liệu dựa trên tệp hoặc bên thứ ba nào khác.
Yêu cầu quyền truy cập
Để chạy một gói chứa tác vụ Lập hồ sơ dữ liệu, tài khoản người dùng phải có quyền đọc / ghi với quyền TẠO BẢNG trên cơ sở dữ liệu tempdb.
Trình xem hồ sơ dữ liệu
Data Profile Viewer được sử dụng để xem lại đầu ra của hồ sơ. Trình xem hồ sơ dữ liệu cũng hỗ trợ khả năng xem chi tiết để giúp bạn hiểu các vấn đề về chất lượng dữ liệu được xác định trong đầu ra hồ sơ. Khả năng đi sâu này sẽ gửi các truy vấn trực tiếp đến nguồn dữ liệu ban đầu.
Đánh giá và thiết lập tác vụ lập hồ sơ dữ liệu
Thiết lập tác vụ lập hồ sơ dữ liệu
Nó liên quan đến việc thực thi một gói chứa tác vụ Cấu hình dữ liệu để tính toán các cấu hình. Tác vụ lưu kết quả đầu ra ở định dạng XML vào một tệp hoặc một biến gói.
Xem lại hồ sơ
Để xem cấu hình dữ liệu, hãy gửi đầu ra tới một tệp, sau đó sử dụng Trình xem cấu hình dữ liệu. Trình xem này là một tiện ích độc lập hiển thị đầu ra hồ sơ ở cả định dạng tóm tắt và chi tiết với khả năng xem chi tiết tùy chọn.
Cấu hình dữ liệu - Tùy chọn cấu hình
Tác vụ Cấu hình dữ liệu có các tùy chọn cấu hình thuận tiện sau:
Cột ký tự đại diện
Trong khi định cấu hình yêu cầu hồ sơ, tác vụ chấp nhận ký tự đại diện '*' thay cho tên cột. Điều này đơn giản hóa cấu hình và giúp dễ dàng phát hiện ra các đặc điểm của dữ liệu không quen thuộc hơn. Khi tác vụ chạy, tác vụ sẽ cấu hình mọi cột có kiểu dữ liệu thích hợp.
Hồ sơ nhanh
Bạn có thể chọn Hồ sơ nhanh để cấu hình tác vụ nhanh chóng. Cấu hình nhanh cấu hình một bảng hoặc dạng xem bằng cách sử dụng tất cả các cấu hình và cài đặt mặc định.
Tác vụ lập hồ sơ dữ liệu có thể tính toán tám hồ sơ dữ liệu khác nhau. Năm trong số các cấu hình này có thể kiểm tra các cột riêng lẻ và ba cấu hình còn lại phân tích nhiều cột hoặc mối quan hệ giữa các cột.
Lập hồ sơ dữ liệu - Kết quả công việc
Tác vụ Cấu hình dữ liệu xuất các cấu hình đã chọn sang định dạng XML có cấu trúc như lược đồ DataProfile.xsd.
Bạn có thể lưu bản sao cục bộ của lược đồ và xem bản sao cục bộ của lược đồ trong Microsoft Visual Studio hoặc trình soạn thảo lược đồ khác, trong trình soạn thảo XML hoặc trong trình soạn thảo văn bản như Notepad.