Entreposage de données - Questions d'entretien
Chers lecteurs, ces Data Warehousing Interview Questions ont été spécialement conçus pour vous familiariser avec la nature des questions que vous pourriez rencontrer lors de votre entretien sur le sujet de Data Warehousing.
A : L'entrepôt de données est une collection de données orientée sujet, intégrée, variable dans le temps et non volatile qui prend en charge le processus décisionnel de la direction.
A : Orienté sujet signifie que l'entrepôt de données stocke les informations autour d'un sujet particulier tel que le produit, le client, les ventes, etc.
A : Certaines applications incluent les services financiers, les services bancaires, les biens de consommation, les secteurs de la vente au détail, la fabrication contrôlée.
A : OLAP est un acronyme pour Online Analytical Processing et OLTP est un acronyme de Traitement transactionnel en ligne.
A : Un entrepôt de données contient des informations historiques qui sont mises à disposition pour l'analyse de l'entreprise, tandis qu'une base de données opérationnelle contient les informations actuelles nécessaires à la gestion de l'entreprise.
A : Un entrepôt de données peut implémenter un schéma en étoile, un schéma en flocon de neige et un schéma de constellation de faits.
A : L'entreposage de données est le processus de construction et d'utilisation de l'entrepôt de données.
A : L'entreposage de données implique le nettoyage des données, l'intégration des données et la consolidation des données.
A : Les fonctions exécutées par l'outil et les utilitaires de l'entrepôt de données sont l'extraction de données, le nettoyage des données, la transformation des données, le chargement et l'actualisation des données.
A : L'extraction de données signifie la collecte de données à partir de plusieurs sources hétérogènes.
A: Les métadonnées sont simplement définies comme des données sur les données. En d'autres termes, nous pouvons dire que les métadonnées sont les données résumées qui nous mènent aux données détaillées.
A : Les métadonnées respiratoires contiennent la définition de l'entrepôt de données, les métadonnées commerciales, les métadonnées opérationnelles, les données pour la cartographie de l'environnement opérationnel à l'entrepôt de données et les algorithmes de synthèse.
A: Le cube de données nous aide à représenter les données dans plusieurs dimensions. Le cube de données est défini par des dimensions et des faits.
A : Les dimensions sont les entités par rapport auxquelles une entreprise conserve les enregistrements.
A: Le magasin de données contient le sous-ensemble de données à l'échelle de l'organisation. Ce sous-ensemble de données est précieux pour des groupes spécifiques d'une organisation. En d'autres termes, on peut dire qu'un data mart contient des données spécifiques à un groupe particulier.
A : La vue sur un entrepôt de données opérationnel est appelée entrepôt virtuel.
A : Les étapes sont la stratégie informatique, l'éducation, l'analyse de rentabilité, le plan technique, la création de la version, le chargement de l'historique, la requête ad hoc, l'évolution des exigences, l'automatisation et l'extension de la portée.
A: Un gestionnaire de charge effectue les opérations nécessaires pour extraire et charger le processus. La taille et la complexité du gestionnaire de charge varient entre les solutions spécifiques, de l'entrepôt de données à l'entrepôt de données.
A: Un gestionnaire de charge extrait les données du système source. Chargez rapidement les données extraites dans le magasin de données temporaire. Effectuez des transformations simples en structure similaire à celle de l'entrepôt de données.
A: Le responsable de l'entrepôt est responsable du processus de gestion de l'entrepôt. Le gestionnaire d'entrepôt se compose de logiciels système tiers, de programmes C et de scripts shell. La taille et la complexité du gestionnaire d'entrepôt varient selon les solutions spécifiques.
A : Le responsable de l'entrepôt effectue des contrôles de cohérence et d'intégrité référentielle, crée les index, les vues d'entreprise, les vues de partition par rapport aux données de base, transforme et fusionne les données source dans le magasin temporaire dans l'entrepôt de données publié, sauvegarde les données dans l'entrepôt de données, et archive les données qui ont atteint la fin de leur vie capturée.
A : Les informations récapitulatives sont la zone de l'entrepôt de données dans laquelle les agrégations prédéfinies sont conservées.
A : Query Manager est chargé de diriger les requêtes vers les tables appropriées.
A : Il existe quatre types de serveurs OLAP, à savoir les serveurs OLAP relationnel, OLAP multidimensionnel, OLAP hybride et les serveurs SQL spécialisés.
A : OLAP multidimensionnel est plus rapide que OLAP relationnel.
A : OLAP exécute des fonctions telles que roll-up, drill-down, slice, dice et pivot.
A : Une seule dimension est sélectionnée pour l'opération de tranche.
A : Pour le fonctionnement des dés, deux dimensions ou plus sont sélectionnées pour un cube donné.
A : Il n'y a qu'une seule table de faits dans un schéma en étoile.
A : La normalisation divise les données en tables supplémentaires.
A : Le schéma Snowflake utilise le concept de normalisation.
A : La normalisation aide à réduire la redondance des données.
A : Le langage de requête d'exploration de données (DMQL) est utilisé pour la définition de schéma.
A : DMQL est basé sur le langage de requête structuré (SQL).
A : Le partitionnement est effectué pour diverses raisons telles qu'une gestion facile, pour aider la récupération de sauvegarde, pour améliorer les performances.
A : Data Marting implique le coût du matériel et des logiciels, le coût d'accès au réseau et le coût du temps.