SGBD distribué - Bases de données distribuées
Ce chapitre présente le concept de DDBMS. Dans une base de données distribuée, il existe un certain nombre de bases de données qui peuvent être réparties géographiquement dans le monde entier. Un SGBD distribué gère la base de données distribuée de manière à ce qu'elle apparaisse comme une seule base de données aux utilisateurs. Dans la dernière partie du chapitre, nous étudions les facteurs qui conduisent aux bases de données distribuées, ses avantages et ses inconvénients.
UNE distributed database est une collection de plusieurs bases de données interconnectées, qui sont réparties physiquement sur divers emplacements qui communiquent via un réseau informatique.
traits
Les bases de données de la collection sont logiquement liées les unes aux autres. Souvent, ils représentent une seule base de données logique.
Les données sont physiquement stockées sur plusieurs sites. Les données de chaque site peuvent être gérées par un SGBD indépendant des autres sites.
Les processeurs des sites sont connectés via un réseau. Ils n'ont aucune configuration multiprocesseur.
Une base de données distribuée n'est pas un système de fichiers faiblement connecté.
Une base de données distribuée incorpore le traitement des transactions, mais elle n'est pas synonyme de système de traitement des transactions.
Système de gestion de base de données distribué
Un système de gestion de base de données distribuée (DDBMS) est un système logiciel centralisé qui gère une base de données distribuée comme si tout était stocké dans un seul emplacement.
traits
Il est utilisé pour créer, récupérer, mettre à jour et supprimer des bases de données distribuées.
Il synchronise périodiquement la base de données et fournit des mécanismes d'accès grâce auxquels la distribution devient transparente pour les utilisateurs.
Il garantit que les données modifiées sur n'importe quel site sont mises à jour universellement.
Il est utilisé dans les domaines d'application où de grands volumes de données sont traités et accédés simultanément par de nombreux utilisateurs.
Il est conçu pour les plates-formes de bases de données hétérogènes.
Il préserve la confidentialité et l'intégrité des données des bases de données.
Facteurs encourageant le DDBMS
Les facteurs suivants encouragent le passage à DDBMS -
Distributed Nature of Organizational Units- La plupart des organisations à l'heure actuelle sont subdivisées en plusieurs unités qui sont physiquement réparties dans le monde entier. Chaque unité nécessite son propre ensemble de données locales. Ainsi, la base de données globale de l'organisation est distribuée.
Need for Sharing of Data- Les multiples unités organisationnelles ont souvent besoin de communiquer entre elles et de partager leurs données et ressources. Cela nécessite des bases de données communes ou des bases de données répliquées qui doivent être utilisées de manière synchronisée.
Support for Both OLTP and OLAP- Le traitement des transactions en ligne (OLTP) et le traitement analytique en ligne (OLAP) fonctionnent sur des systèmes diversifiés qui peuvent avoir des données communes. Les systèmes de bases de données distribuées facilitent ces deux traitements en fournissant des données synchronisées.
Database Recovery- L'une des techniques courantes utilisées dans DDBMS est la réplication des données sur différents sites. La réplication des données aide automatiquement à la récupération des données si la base de données d'un site est endommagée. Les utilisateurs peuvent accéder aux données d'autres sites pendant la reconstruction du site endommagé. Ainsi, l'échec de la base de données peut devenir presque invisible pour les utilisateurs.
Support for Multiple Application Software- La plupart des organisations utilisent une variété de logiciels d'application, chacun avec son support de base de données spécifique. DDBMS fournit une fonctionnalité uniforme pour utiliser les mêmes données sur différentes plates-formes.
Avantages des bases de données distribuées
Voici les avantages des bases de données distribuées par rapport aux bases de données centralisées.
Modular Development- Si le système doit être étendu à de nouveaux emplacements ou à de nouvelles unités, dans des systèmes de bases de données centralisées, l'action nécessite des efforts substantiels et une perturbation du fonctionnement existant. Cependant, dans les bases de données distribuées, le travail nécessite simplement d'ajouter de nouveaux ordinateurs et des données locales au nouveau site et enfin de les connecter au système distribué, sans interruption des fonctions actuelles.
More Reliable- En cas de défaillance de la base de données, l'ensemble du système de bases de données centralisées s'arrête. Cependant, dans les systèmes distribués, lorsqu'un composant tombe en panne, le fonctionnement du système continue peut être à des performances réduites. Par conséquent, DDBMS est plus fiable.
Better Response- Si les données sont distribuées de manière efficace, les demandes des utilisateurs peuvent être satisfaites à partir des données locales elles-mêmes, fournissant ainsi une réponse plus rapide. En revanche, dans les systèmes centralisés, toutes les requêtes doivent passer par l'ordinateur central pour être traitées, ce qui augmente le temps de réponse.
Lower Communication Cost- Dans les systèmes de bases de données distribuées, si les données sont localisées localement là où elles sont le plus utilisées, les coûts de communication pour la manipulation des données peuvent être minimisés. Cela n'est pas possible dans les systèmes centralisés.
Adversités des bases de données distribuées
Voici quelques-unes des difficultés associées aux bases de données distribuées.
Need for complex and expensive software - DDBMS nécessite des logiciels complexes et souvent coûteux pour assurer la transparence et la coordination des données sur les différents sites.
Processing overhead - Même des opérations simples peuvent nécessiter un grand nombre de communications et des calculs supplémentaires pour assurer l'uniformité des données sur les sites.
Data integrity - La nécessité de mettre à jour les données sur plusieurs sites pose des problèmes d'intégrité des données.
Overheads for improper data distribution- La réactivité des requêtes dépend en grande partie de la bonne distribution des données. Une mauvaise distribution des données entraîne souvent une réponse très lente aux demandes des utilisateurs.