データウェアハウジング-インタビューの質問
親愛なる読者、これら Data Warehousing Interview Questions 特に、面接中に遭遇する可能性のある質問の性質を理解できるように設計されています。 Data Warehousing。
A :データウェアハウスは、経営陣の意思決定プロセスをサポートする、主題指向の統合された時変の不揮発性データコレクションです。
A :サブジェクト指向は、データウェアハウスが製品、顧客、販売などの特定のサブジェクトに関する情報を格納することを意味します。
A :一部のアプリケーションには、金融サービス、銀行サービス、顧客商品、小売部門、管理された製造が含まれます。
A :OLAPはの頭字語です Online Analytical Processing OLTPは、オンライントランザクション処理の頭字語です。
A :データウェアハウスには、ビジネスの分析に利用できる履歴情報が含まれていますが、運用データベースには、ビジネスの実行に必要な現在の情報が含まれています。
A :データウェアハウスは、スタースキーマ、スノーフレークスキーマ、およびファクトコンステレーションスキーマを実装できます。
A :データウェアハウスは、データウェアハウスを構築して使用するプロセスです。
A :データウェアハウジングには、データクリーニング、データ統合、およびデータ統合が含まれます。
A :データウェアハウスツールとユーティリティによって実行される機能は、データ抽出、データクリーニング、データ変換、データロード、および更新です。
A :データ抽出とは、複数の異種ソースからデータを収集することを意味します。
A:メタデータは、単にデータに関するデータとして定義されます。言い換えれば、メタデータは、詳細なデータにつながる要約データであると言えます。
A :メタデータ呼吸には、データウェアハウス、ビジネスメタデータ、運用メタデータ、運用環境からデータウェアハウスにマッピングするためのデータ、および要約のためのアルゴリズムの定義が含まれています。
A:データキューブは、データを複数の次元で表すのに役立ちます。データキューブは、ディメンションとファクトによって定義されます。
A :ディメンションは、企業がレコードを保持するためのエンティティです。
A:データマートには、組織全体のデータのサブセットが含まれています。このデータのサブセットは、組織の特定のグループにとって価値があります。つまり、データマートには特定のグループに固有のデータが含まれていると言えます。
A :運用データウェアハウスのビューは、仮想ウェアハウスと呼ばれます。
A :段階は、IT戦略、教育、ビジネスケース分析、技術的な青写真、バージョンの構築、履歴の読み込み、アドホッククエリ、要件の進化、自動化、およびスコープの拡張です。
A:ロードマネージャは、プロセスの抽出とロードに必要な操作を実行します。ロードマネージャーのサイズと複雑さは、データウェアハウスごとに特定のソリューション間で異なります。
A:ロードマネージャは、ソースシステムからデータを抽出します。抽出されたデータを一時データストアに高速ロードします。データウェアハウスと同様の構造への単純な変換を実行します。
A:倉庫管理者は、倉庫管理プロセスを担当します。ウェアハウスマネージャーは、サードパーティのシステムソフトウェア、Cプログラム、およびシェルスクリプトで構成されています。ウェアハウスマネージャーのサイズと複雑さは、特定のソリューションによって異なります。
A :ウェアハウスマネージャーは、整合性と参照整合性のチェックを実行し、ベースデータに対してインデックス、ビジネスビュー、パーティションビューを作成し、ソースデータを変換して一時ストアの公開データウェアハウスにマージし、データウェアハウスのデータをバックアップします。キャプチャされた寿命の終わりに達したデータをアーカイブします。
A :要約情報は、事前定義された集計が保持されるデータウェアハウス内の領域です。
A :クエリマネージャは、クエリを適切なテーブルに送信する役割を果たします。
A :OLAPサーバーには、リレーショナルOLAP、多次元OLAP、ハイブリッドOLAP、および特殊SQLサーバーの4種類があります。
A :多次元OLAPはリレーショナルOLAPよりも高速です。
A :OLAPは、ロールアップ、ドリルダウン、スライス、ダイス、ピボットなどの機能を実行します。
A :スライス操作で1つの次元のみが選択されます。
A :サイコロ操作では、特定のキューブに対して2つ以上の次元が選択されます。
A :スタースキーマにはファクトテーブルが1つだけあります。
A :正規化により、データが追加のテーブルに分割されます。
A :スノーフレークスキーマは、正規化の概念を使用しています。
A :正規化は、データの冗長性を減らすのに役立ちます。
A :スキーマ定義にはデータマイニングクエリ言語(DMQL)が使用されます。
A :DMQLは、構造化照会言語(SQL)に基づいています。
A :パーティショニングは、管理の容易さ、バックアップリカバリの支援、パフォーマンスの向上など、さまざまな理由で行われます。
A :データマートには、ハードウェアとソフトウェアのコスト、ネットワークアクセスのコスト、および時間のコストが含まれます。