SAPHANA-SQLデータプロファイリング

SQLデータプロファイリングタスクは、複数のデータソースからのデータを理解して分析するために使用されます。これは、データウェアハウスにロードされる前に、不正確で不完全なデータを削除し、データ品質の問題を防ぐために使用されます。

SQLデータプロファイリングタスクの利点は次のとおりです-

  • ソースデータをより効果的に分析するのに役立ちます。

  • ソースデータをよりよく理解するのに役立ちます。

  • データウェアハウスにロードされる前に、不正確で不完全なデータを削除し、データ品質を向上させます。

  • これは、抽出、変換、および読み込みタスクで使用されます。

データプロファイリングタスクは、データソースを理解し、修正が必要なデータの問題を特定するのに役立つプロファイルをチェックします。

Integration Servicesパッケージ内のデータプロファイリングタスクを使用して、SQL Serverに格納されているデータをプロファイリングし、データ品質に関する潜在的な問題を特定できます。

Note −データプロファイリングタスクはSQL Serverデータソースでのみ機能し、他のファイルベースまたはサードパーティのデータソースをサポートしません。

アクセス要件

パッケージに含まれるデータプロファイリングタスクを実行するには、ユーザーアカウントに、tempdbデータベースに対するCREATETABLE権限を持つ読み取り/書き込み権限が必要です。

データプロファイラービューア

データプロファイルビューアは、プロファイラー出力を確認するために使用されます。データプロファイルビューアは、プロファイル出力で識別されるデータ品質の問題を理解するのに役立つドリルダウン機能もサポートしています。このドリルダウン機能は、ライブクエリを元のデータソースに送信します。

データプロファイリングタスクのセットアップとレビュー

データプロファイリングタスクの設定

これには、プロファイルを計算するためのデータプロファイリングタスクを含むパッケージの実行が含まれます。タスクは、出力をXML形式でファイルまたはパッケージ変数に保存します。

プロファイルの確認

データプロファイルを表示するには、出力をファイルに送信してから、データプロファイルビューアを使用します。このビューアは、オプションのドリルダウン機能を使用して、プロファイル出力を要約形式と詳細形式の両方で表示するスタンドアロンユーティリティです。

データプロファイリング-構成オプション

データプロファイリングタスクには、次の便利な構成オプションがあります-

ワイルドカード列

プロファイル要求の構成中に、タスクは列名の代わりに「*」ワイルドカードを受け入れます。これにより、構成が簡素化され、見慣れないデータの特性を簡単に発見できるようになります。タスクが実行されると、タスクは適切なデータ型を持つすべての列をプロファイルします。

クイックプロファイル

クイックプロファイルを選択して、タスクをすばやく構成できます。クイックプロファイルは、すべてのデフォルトのプロファイルと設定を使用して、テーブルまたはビューのプロファイルを作成します。

データプロファイリングタスクは、8つの異なるデータプロファイルを計算できます。これらのプロファイルのうち5つは個々の列をチェックでき、残りの3つは複数の列または列間の関係を分析できます。

データプロファイリング-タスク出力

データプロファイリングタスクは、選択したプロファイルをDataProfile.xsdスキーマのように構造化されたXML形式に出力します。

スキーマのローカルコピーを保存し、Microsoft Visual Studioまたは別のスキーマエディター、XMLエディター、またはメモ帳などのテキストエディターでスキーマのローカルコピーを表示できます。