SGBD distribué - Guide rapide
Pour le bon fonctionnement de toute organisation, il est nécessaire de disposer d'une base de données bien entretenue. Dans un passé récent, les bases de données étaient de nature centralisée. Cependant, avec l'augmentation de la mondialisation, les organisations ont tendance à être diversifiées à travers le monde. Ils peuvent choisir de distribuer les données sur des serveurs locaux au lieu d'une base de données centrale. Ainsi, est arrivé le concept deDistributed Databases.
Ce chapitre donne un aperçu des bases de données et des systèmes de gestion de base de données (SGBD). Une base de données est une collection ordonnée de données associées. Un SGBD est un progiciel permettant de travailler sur une base de données. Une étude détaillée du SGBD est disponible dans notre tutoriel intitulé «Apprendre le SGBD». Dans ce chapitre, nous révisons les principaux concepts afin que l'étude de DDBMS puisse se faire facilement. Les trois sujets abordés sont les schémas de base de données, les types de bases de données et les opérations sur les bases de données.
Base de données et système de gestion de bases de données
UNE databaseest une collection ordonnée de données connexes qui est construite dans un but précis. Une base de données peut être organisée comme une collection de plusieurs tables, où une table représente un élément ou une entité du monde réel. Chaque table comporte plusieurs champs différents qui représentent les caractéristiques de l'entité.
Par exemple, une base de données d'entreprise peut inclure des tableaux pour les projets, les employés, les services, les produits et les dossiers financiers. Les champs de la table Employee peuvent être Nom, Company_Id, Date_of_Joining, etc.
UNE database management systemest un ensemble de programmes permettant la création et la maintenance d'une base de données. Le SGBD est disponible sous forme de progiciel qui facilite la définition, la construction, la manipulation et le partage des données dans une base de données. La définition d'une base de données comprend la description de la structure d'une base de données. La construction d'une base de données implique le stockage réel des données sur n'importe quel support de stockage. La manipulation fait référence à la récupération des informations de la base de données, à la mise à jour de la base de données et à la génération de rapports. Le partage de données facilite l'accès aux données par différents utilisateurs ou programmes.
Exemples de domaines d'application du SGBD
- Guichets automatiques
- Système de réservation de train
- Système de gestion des employés
- Système d'information étudiant
Exemples de packages SGBD
- MySQL
- Oracle
- serveur SQL
- dBASE
- FoxPro
- PostgreSQL, etc.
Schémas de base de données
Un schéma de base de données est une description de la base de données qui est spécifiée lors de la conception de la base de données et sujette à des modifications peu fréquentes. Il définit l'organisation des données, les relations entre elles et les contraintes qui leur sont associées.
Les bases de données sont souvent représentées par three-schema architecture ou ANSISPARC architecture. Le but de cette architecture est de séparer l'application utilisateur de la base de données physique. Les trois niveaux sont -
Internal Level having Internal Schema - Il décrit la structure physique, les détails du stockage interne et les chemins d'accès à la base de données.
Conceptual Level having Conceptual Schema- Il décrit la structure de l'ensemble de la base de données tout en masquant les détails du stockage physique des données. Cela illustre les entités, les attributs avec leurs types de données et leurs contraintes, les opérations des utilisateurs et leurs relations.
External or View Level having External Schemas or Views - Il décrit la partie d'une base de données pertinente pour un utilisateur particulier ou un groupe d'utilisateurs tout en cachant le reste de la base de données.
Types de SGBD
Il existe quatre types de SGBD.
SGBD hiérarchique
Dans le SGBD hiérarchique, les relations entre les données de la base de données sont établies de telle sorte qu'un élément de données existe en tant que subordonné d'un autre. Les éléments de données ont des relations parent-enfant et sont modélisés à l'aide de la structure de données «arborescente». Celles-ci sont très rapides et simples.
SGBD réseau
SGBD réseau dans un où les relations entre les données de la base de données sont de type plusieurs-à-plusieurs sous la forme d'un réseau. La structure est généralement compliquée en raison de l'existence de nombreuses relations plusieurs-à-plusieurs. Le SGBD réseau est modélisé à l'aide d'une structure de données «graphique».
SGBD relationnel
Dans les bases de données relationnelles, la base de données est représentée sous la forme de relations. Chaque relation modélise une entité et est représentée sous forme de tableau de valeurs. Dans la relation ou la table, une ligne est appelée un tuple et désigne un seul enregistrement. Une colonne s'appelle un champ ou un attribut et désigne une propriété caractéristique de l'entité. Le SGBDR est le système de gestion de base de données le plus populaire.
Par exemple - Une relation étudiante -
SGBD orienté objet
Le SGBD orienté objet est dérivé du modèle du paradigme de programmation orienté objet. Ils sont utiles pour représenter à la fois des données cohérentes stockées dans des bases de données, ainsi que des données transitoires, telles que celles trouvées dans l'exécution de programmes. Ils utilisent de petits éléments réutilisables appelés objets. Chaque objet contient une partie de données et un ensemble d'opérations qui travaillent sur les données. L'objet et ses attributs sont accessibles via des pointeurs au lieu d'être stockés dans des modèles de table relationnelle.
Par exemple - Une base de données simplifiée orientée objet de compte bancaire -
SGBD distribué
Une base de données distribuée est un ensemble de bases de données interconnectées qui sont distribuées sur le réseau informatique ou Internet. Un système de gestion de base de données distribuée (DDBMS) gère la base de données distribuée et fournit des mécanismes permettant de rendre les bases de données transparentes pour les utilisateurs. Dans ces systèmes, les données sont intentionnellement réparties entre plusieurs nœuds afin que toutes les ressources informatiques de l'organisation puissent être utilisées de manière optimale.
Opérations sur SGBD
Les quatre opérations de base sur une base de données sont Créer, Récupérer, Mettre à jour et Supprimer.
CREATE structure de la base de données et la remplir avec des données - La création d'une relation de base de données implique de spécifier les structures de données, les types de données et les contraintes des données à stocker.
Example - Commande SQL pour créer une table étudiant -
CREATE TABLE STUDENT (
ROLL INTEGER PRIMARY KEY,
NAME VARCHAR2(25),
YEAR INTEGER,
STREAM VARCHAR2(10)
);
Une fois le format de données défini, les données réelles sont stockées conformément au format dans un support de stockage.
Example Commande SQL pour insérer un seul tuple dans la table des étudiants -
INSERT INTO STUDENT ( ROLL, NAME, YEAR, STREAM)
VALUES ( 1, 'ANKIT JHA', 1, 'COMPUTER SCIENCE');
RETRIEVEinformations de la base de données - La récupération d'informations implique généralement de sélectionner un sous-ensemble d'une table ou d'afficher des données de la table après que certains calculs ont été effectués. Cela se fait en interrogeant sur la table.
Example - Pour récupérer les noms de tous les étudiants du flux Informatique, la requête SQL suivante doit être exécutée -
SELECT NAME FROM STUDENT
WHERE STREAM = 'COMPUTER SCIENCE';
UPDATE informations stockées et modifier la structure de la base de données - La mise à jour d'une table implique la modification des anciennes valeurs dans les lignes de la table existante avec de nouvelles valeurs.
Example - Commande SQL pour changer le flux de l'électronique à l'électronique et aux communications -
UPDATE STUDENT
SET STREAM = 'ELECTRONICS AND COMMUNICATIONS'
WHERE STREAM = 'ELECTRONICS';
Modifier la base de données signifie changer la structure de la table. Cependant, la modification du tableau est soumise à un certain nombre de restrictions.
Example - Pour ajouter un nouveau champ ou une nouvelle colonne, disons adresse à la table Student, nous utilisons la commande SQL suivante -
ALTER TABLE STUDENT
ADD ( ADDRESS VARCHAR2(50) );
DELETE informations stockées ou supprimer une table dans son ensemble - La suppression d'informations spécifiques implique la suppression de lignes sélectionnées de la table qui remplit certaines conditions.
Example- Pour supprimer tous les élèves qui sont actuellement en 4 ème année lorsqu'ils s'évanouissent, nous utilisons la commande SQL -
DELETE FROM STUDENT
WHERE YEAR = 4;
Alternativement, la table entière peut être supprimée de la base de données.
Example - Pour supprimer complètement la table des étudiants, la commande SQL utilisée est -
DROP TABLE STUDENT;
Ce chapitre présente le concept de DDBMS. Dans une base de données distribuée, il existe un certain nombre de bases de données qui peuvent être réparties géographiquement dans le monde entier. Un SGBD distribué gère la base de données distribuée de manière à ce qu'elle apparaisse comme une seule base de données aux utilisateurs. Dans la dernière partie du chapitre, nous étudions les facteurs qui conduisent aux bases de données distribuées, ses avantages et ses inconvénients.
UNE distributed database est une collection de plusieurs bases de données interconnectées, qui sont réparties physiquement sur divers emplacements qui communiquent via un réseau informatique.
traits
Les bases de données de la collection sont logiquement liées les unes aux autres. Souvent, ils représentent une seule base de données logique.
Les données sont physiquement stockées sur plusieurs sites. Les données de chaque site peuvent être gérées par un SGBD indépendant des autres sites.
Les processeurs des sites sont connectés via un réseau. Ils n'ont aucune configuration multiprocesseur.
Une base de données distribuée n'est pas un système de fichiers faiblement connecté.
Une base de données distribuée incorpore le traitement des transactions, mais elle n'est pas synonyme de système de traitement des transactions.
Système de gestion de base de données distribué
Un système de gestion de base de données distribuée (DDBMS) est un système logiciel centralisé qui gère une base de données distribuée comme si tout était stocké dans un seul emplacement.
traits
Il est utilisé pour créer, récupérer, mettre à jour et supprimer des bases de données distribuées.
Il synchronise périodiquement la base de données et fournit des mécanismes d'accès grâce auxquels la distribution devient transparente pour les utilisateurs.
Il garantit que les données modifiées sur n'importe quel site sont mises à jour universellement.
Il est utilisé dans les domaines d'application où de grands volumes de données sont traités et accédés simultanément par de nombreux utilisateurs.
Il est conçu pour les plates-formes de bases de données hétérogènes.
Il préserve la confidentialité et l'intégrité des données des bases de données.
Facteurs encourageant le DDBMS
Les facteurs suivants encouragent le passage à DDBMS -
Distributed Nature of Organizational Units- La plupart des organisations à l'heure actuelle sont subdivisées en plusieurs unités qui sont physiquement réparties dans le monde entier. Chaque unité nécessite son propre ensemble de données locales. Ainsi, la base de données globale de l'organisation est distribuée.
Need for Sharing of Data- Les multiples unités organisationnelles ont souvent besoin de communiquer entre elles et de partager leurs données et ressources. Cela nécessite des bases de données communes ou des bases de données répliquées qui doivent être utilisées de manière synchronisée.
Support for Both OLTP and OLAP- Le traitement des transactions en ligne (OLTP) et le traitement analytique en ligne (OLAP) fonctionnent sur des systèmes diversifiés qui peuvent avoir des données communes. Les systèmes de bases de données distribuées facilitent ces deux traitements en fournissant des données synchronisées.
Database Recovery- L'une des techniques courantes utilisées dans DDBMS est la réplication des données sur différents sites. La réplication des données aide automatiquement à la récupération des données si la base de données d'un site est endommagée. Les utilisateurs peuvent accéder aux données d'autres sites pendant la reconstruction du site endommagé. Ainsi, l'échec de la base de données peut devenir presque invisible pour les utilisateurs.
Support for Multiple Application Software- La plupart des organisations utilisent une variété de logiciels d'application, chacun avec son support de base de données spécifique. DDBMS fournit une fonctionnalité uniforme pour utiliser les mêmes données sur différentes plates-formes.
Avantages des bases de données distribuées
Voici les avantages des bases de données distribuées par rapport aux bases de données centralisées.
Modular Development- Si le système doit être étendu à de nouveaux emplacements ou à de nouvelles unités, dans des systèmes de bases de données centralisées, l'action nécessite des efforts substantiels et une perturbation du fonctionnement existant. Cependant, dans les bases de données distribuées, le travail nécessite simplement d'ajouter de nouveaux ordinateurs et des données locales au nouveau site et enfin de les connecter au système distribué, sans interruption des fonctions actuelles.
More Reliable- En cas de défaillance de la base de données, l'ensemble du système de bases de données centralisées s'arrête. Cependant, dans les systèmes distribués, lorsqu'un composant tombe en panne, le fonctionnement du système continue peut être à une performance réduite. Par conséquent, DDBMS est plus fiable.
Better Response- Si les données sont distribuées de manière efficace, les demandes des utilisateurs peuvent être satisfaites à partir des données locales elles-mêmes, fournissant ainsi une réponse plus rapide. En revanche, dans les systèmes centralisés, toutes les requêtes doivent passer par l'ordinateur central pour être traitées, ce qui augmente le temps de réponse.
Lower Communication Cost- Dans les systèmes de bases de données distribuées, si les données sont localisées localement là où elles sont le plus utilisées, les coûts de communication pour la manipulation des données peuvent être minimisés. Cela n'est pas possible dans les systèmes centralisés.
Adversités des bases de données distribuées
Voici quelques-unes des difficultés associées aux bases de données distribuées.
Need for complex and expensive software - DDBMS nécessite des logiciels complexes et souvent coûteux pour assurer la transparence et la coordination des données sur les différents sites.
Processing overhead - Même des opérations simples peuvent nécessiter un grand nombre de communications et des calculs supplémentaires pour assurer l'uniformité des données sur les sites.
Data integrity - La nécessité de mettre à jour les données sur plusieurs sites pose des problèmes d'intégrité des données.
Overheads for improper data distribution- La réactivité des requêtes dépend en grande partie de la bonne distribution des données. Une mauvaise distribution des données entraîne souvent une réponse très lente aux demandes des utilisateurs.
Dans cette partie du didacticiel, nous étudierons les différents aspects qui aident à concevoir des environnements de bases de données distribuées. Ce chapitre commence par les types de bases de données distribuées. Les bases de données distribuées peuvent être classées en bases de données homogènes et hétérogènes ayant des divisions supplémentaires. La section suivante de ce chapitre traite des architectures distribuées à savoir client-serveur, peer-to-peer et multi-SGBD. Enfin, les différentes alternatives de conception comme la réplication et la fragmentation sont introduites.
Types de bases de données distribuées
Les bases de données distribuées peuvent être globalement classées en environnements de bases de données distribuées homogènes et hétérogènes, chacun avec des sous-divisions supplémentaires, comme indiqué dans l'illustration suivante.
Bases de données distribuées homogènes
Dans une base de données distribuée homogène, tous les sites utilisent des SGBD et des systèmes d'exploitation identiques. Ses propriétés sont -
Les sites utilisent des logiciels très similaires.
Les sites utilisent des SGBD ou des SGBD identiques du même fournisseur.
Chaque site connaît tous les autres sites et coopère avec d'autres sites pour traiter les demandes des utilisateurs.
La base de données est accessible via une seule interface comme s'il s'agissait d'une seule base de données.
Types de base de données distribuée homogène
Il existe deux types de base de données distribuée homogène -
Autonomous- Chaque base de données est indépendante et fonctionne de manière autonome. Ils sont intégrés par une application de contrôle et utilisent la transmission de messages pour partager les mises à jour des données.
Non-autonomous - Les données sont réparties sur les nœuds homogènes et un SGBD central ou maître coordonne les mises à jour des données sur les sites.
Bases de données distribuées hétérogènes
Dans une base de données distribuée hétérogène, différents sites ont différents systèmes d'exploitation, produits SGBD et modèles de données. Ses propriétés sont -
Différents sites utilisent des schémas et des logiciels différents.
Le système peut être composé d'une variété de SGBD tels que relationnel, réseau, hiérarchique ou orienté objet.
Le traitement des requêtes est complexe en raison de schémas différents.
Le traitement des transactions est complexe en raison de logiciels différents.
Un site peut ne pas être au courant d'autres sites et il y a donc une coopération limitée dans le traitement des demandes des utilisateurs.
Types de bases de données distribuées hétérogènes
Federated - Les systèmes de base de données hétérogènes sont de nature indépendante et intégrés ensemble de sorte qu'ils fonctionnent comme un système de base de données unique.
Un-federated - Les systèmes de bases de données utilisent un module de coordination central par lequel les bases de données sont accessibles.
Architectures de SGBD distribuées
Les architectures DDBMS sont généralement développées en fonction de trois paramètres -
Distribution - Il indique la répartition physique des données sur les différents sites.
Autonomy - Il indique la répartition du contrôle du système de base de données et le degré auquel chaque SGBD constitutif peut fonctionner indépendamment.
Heterogeneity - Il fait référence à l'uniformité ou à la dissemblance des modèles de données, des composants du système et des bases de données.
Modèles architecturaux
Certains des modèles architecturaux courants sont -
- Client - Architecture serveur pour DDBMS
- Architecture peer-to-peer pour DDBMS
- Architecture multi-SGBD
Client - Architecture serveur pour DDBMS
Il s'agit d'une architecture à deux niveaux où la fonctionnalité est divisée en serveurs et clients. Les fonctions du serveur englobent principalement la gestion des données, le traitement des requêtes, l'optimisation et la gestion des transactions. Les fonctions client incluent principalement l'interface utilisateur. Cependant, ils ont certaines fonctions comme la vérification de la cohérence et la gestion des transactions.
Les deux différentes architectures client-serveur sont -
- Client multiple de serveur unique
- Multiple Server Multiple Client (illustré dans le diagramme suivant)
Architecture peer-to-peer pour DDBMS
Dans ces systèmes, chaque pair agit à la fois en tant que client et serveur pour transmettre des services de base de données. Les pairs partagent leurs ressources avec d'autres pairs et coordonnent leurs activités.
Cette architecture comporte généralement quatre niveaux de schémas -
Global Conceptual Schema - Représente la vue logique globale des données.
Local Conceptual Schema - Représente l'organisation logique des données sur chaque site.
Local Internal Schema - Représente l'organisation physique des données sur chaque site.
External Schema - Représente la vue utilisateur des données.
Architectures multi-SGBD
Il s'agit d'un système de base de données intégré formé par une collection de deux ou plusieurs systèmes de base de données autonomes.
Le multi-SGBD peut être exprimé à travers six niveaux de schémas -
Multi-database View Level - Représente plusieurs vues utilisateur comprenant des sous-ensembles de la base de données distribuée intégrée.
Multi-database Conceptual Level - Représente une multi-base de données intégrée qui comprend des définitions de structure de multi-base de données logique globale.
Multi-database Internal Level - Représente la distribution des données sur différents sites et multi-base de données vers le mappage de données locales.
Local database View Level - Représente la vue publique des données locales.
Local database Conceptual Level - Représente l'organisation locale des données sur chaque site.
Local database Internal Level - Représente l'organisation physique des données sur chaque site.
Il existe deux alternatives de conception pour le multi-SGBD -
- Modèle avec niveau conceptuel multi-bases de données.
- Modèle sans niveau conceptuel multi-bases de données.
Alternatives de conception
Les alternatives de conception de distribution pour les tables dans un DDBMS sont les suivantes:
- Non répliqué et non fragmenté
- Entièrement répliqué
- Partiellement répliqué
- Fragmented
- Mixed
Non répliqué et non fragmenté
Dans cette alternative de conception, différentes tables sont placées sur différents sites. Les données sont placées de manière à être à proximité immédiate du site où elles sont le plus utilisées. Il convient le mieux aux systèmes de base de données où le pourcentage de requêtes nécessaires pour joindre des informations dans des tables placées sur différents sites est faible. Si une stratégie de distribution appropriée est adoptée, cette alternative de conception permet de réduire le coût de communication pendant le traitement des données.
Entièrement répliqué
Dans cette variante de conception, sur chaque site, une copie de toutes les tables de la base de données est stockée. Étant donné que chaque site possède sa propre copie de l'ensemble de la base de données, les requêtes sont très rapides nécessitant un coût de communication négligeable. Au contraire, la redondance massive des données nécessite un coût énorme lors des opérations de mise à jour. Par conséquent, cela convient aux systèmes où un grand nombre de requêtes doit être traité alors que le nombre de mises à jour de la base de données est faible.
Partiellement répliqué
Des copies de tables ou des portions de tables sont stockées sur différents sites. La distribution des tableaux se fait en fonction de la fréquence d'accès. Cela tient compte du fait que la fréquence d'accès aux tableaux varie considérablement d'un site à l'autre. Le nombre de copies des tables (ou portions) dépend de la fréquence d'exécution des requêtes d'accès et du site qui génère les requêtes d'accès.
Fragmenté
Dans cette conception, une table est divisée en deux ou plusieurs éléments appelés fragments ou partitions, et chaque fragment peut être stocké sur différents sites. Cela tient compte du fait qu'il arrive rarement que toutes les données stockées dans une table soient requises sur un site donné. De plus, la fragmentation augmente le parallélisme et offre une meilleure reprise après sinistre. Ici, il n'y a qu'une seule copie de chaque fragment dans le système, c'est-à-dire pas de données redondantes.
Les trois techniques de fragmentation sont -
- Fragmentation verticale
- Fragmentation horizontale
- Fragmentation hybride
Distribution mixte
Il s'agit d'une combinaison de fragmentation et de réplications partielles. Ici, les tableaux sont initialement fragmentés sous n'importe quelle forme (horizontale ou verticale), puis ces fragments sont partiellement répliqués sur les différents sites en fonction de la fréquence d'accès aux fragments.
Dans le dernier chapitre, nous avions introduit différentes alternatives de conception. Dans ce chapitre, nous étudierons les stratégies qui aident à adopter les conceptions. Les stratégies peuvent être globalement divisées en réplication et fragmentation. Cependant, dans la plupart des cas, une combinaison des deux est utilisée.
Réplication de données
La réplication des données est le processus de stockage de copies séparées de la base de données sur deux sites ou plus. C'est une technique populaire de tolérance aux pannes des bases de données distribuées.
Avantages de la réplication des données
Reliability - En cas de défaillance d'un site, le système de base de données continue de fonctionner puisqu'une copie est disponible sur un ou plusieurs autres sites.
Reduction in Network Load- Étant donné que des copies locales des données sont disponibles, le traitement des requêtes peut être effectué avec une utilisation réduite du réseau, en particulier aux heures de grande écoute. La mise à jour des données peut être effectuée aux heures creuses.
Quicker Response - La disponibilité de copies locales des données garantit un traitement rapide des requêtes et par conséquent un temps de réponse rapide.
Simpler Transactions- Les transactions nécessitent moins de jointures de tables situées sur différents sites et une coordination minimale sur le réseau. Ainsi, ils deviennent de nature plus simple.
Inconvénients de la réplication des données
Increased Storage Requirements- La conservation de plusieurs copies de données est associée à des coûts de stockage accrus. L'espace de stockage requis est en multiples du stockage requis pour un système centralisé.
Increased Cost and Complexity of Data Updating- Chaque fois qu'une donnée est mise à jour, la mise à jour doit être reflétée dans toutes les copies des données sur les différents sites. Cela nécessite des techniques et des protocoles de synchronisation complexes.
Undesirable Application – Database coupling- Si des mécanismes de mise à jour complexes ne sont pas utilisés, la suppression de l'incohérence des données nécessite une coordination complexe au niveau de l'application. Il en résulte un couplage indésirable application - base de données.
Certaines techniques de réplication couramment utilisées sont:
- Réplication de snapshot
- Réplication en temps quasi réel
- Réplication pull
Fragmentation
La fragmentation consiste à diviser une table en un ensemble de tables plus petites. Les sous-ensembles de la table sont appelésfragments. La fragmentation peut être de trois types: horizontale, verticale et hybride (combinaison horizontale et verticale). La fragmentation horizontale peut en outre être classée en deux techniques: la fragmentation horizontale primaire et la fragmentation horizontale dérivée.
La fragmentation doit être effectuée de manière à ce que la table d'origine puisse être reconstruite à partir des fragments. Cela est nécessaire pour que la table d'origine puisse être reconstruite à partir des fragments chaque fois que nécessaire. Cette exigence est appelée «reconstructivité».
Avantages de la fragmentation
Puisque les données sont stockées à proximité du site d'utilisation, l'efficacité du système de base de données est augmentée.
Les techniques d'optimisation des requêtes locales sont suffisantes pour la plupart des requêtes car les données sont disponibles localement.
Étant donné que les données non pertinentes ne sont pas disponibles sur les sites, la sécurité et la confidentialité du système de base de données peuvent être maintenues.
Inconvénients de la fragmentation
Lorsque des données provenant de différents fragments sont nécessaires, les vitesses d'accès peuvent être très élevées.
En cas de fragmentations récursives, le travail de reconstruction nécessitera des techniques coûteuses.
Le manque de copies de sauvegarde des données dans différents sites peut rendre la base de données inefficace en cas de défaillance d'un site.
Fragmentation verticale
Dans la fragmentation verticale, les champs ou colonnes d'une table sont regroupés en fragments. Afin de maintenir la reconstructivité, chaque fragment doit contenir le (s) champ (s) de clé primaire de la table. La fragmentation verticale peut être utilisée pour renforcer la confidentialité des données.
Par exemple, considérons qu'une base de données University conserve des enregistrements de tous les étudiants inscrits dans une table Student ayant le schéma suivant.
ÉTUDIANT
Regd_No | Nom | Cours | Adresse | Semestre | Honoraires | Des marques |
Désormais, les détails des frais sont conservés dans la section des comptes. Dans ce cas, le concepteur fragmentera la base de données comme suit -
CREATE TABLE STD_FEES AS
SELECT Regd_No, Fees
FROM STUDENT;
Fragmentation horizontale
La fragmentation horizontale regroupe les tuples d'une table en fonction des valeurs d'un ou plusieurs champs. La fragmentation horizontale doit également confirmer la règle de la reconstruction. Chaque fragment horizontal doit avoir toutes les colonnes de la table de base d'origine.
Par exemple, dans le schéma de l'étudiant, si les détails de tous les étudiants du cours d'informatique doivent être conservés à l'École d'informatique, le concepteur fragmentera horizontalement la base de données comme suit -
CREATE COMP_STD AS
SELECT * FROM STUDENT
WHERE COURSE = "Computer Science";
Fragmentation hybride
Dans la fragmentation hybride, une combinaison de techniques de fragmentation horizontale et verticale est utilisée. C'est la technique de fragmentation la plus flexible car elle génère des fragments avec un minimum d'informations étrangères. Cependant, la reconstruction de la table d'origine est souvent une tâche coûteuse.
La fragmentation hybride peut être effectuée de deux manières différentes -
Dans un premier temps, générez un ensemble de fragments horizontaux; puis générer des fragments verticaux à partir d'un ou plusieurs des fragments horizontaux.
Dans un premier temps, générez un ensemble de fragments verticaux; puis générer des fragments horizontaux à partir d'un ou plusieurs des fragments verticaux.
La transparence de la distribution est la propriété des bases de données distribuées en vertu desquelles les détails internes de la distribution sont cachés aux utilisateurs. Le concepteur DDBMS peut choisir de fragmenter les tables, de répliquer les fragments et de les stocker sur différents sites. Cependant, comme les utilisateurs ignorent ces détails, ils trouvent la base de données distribuée facile à utiliser comme n'importe quelle base de données centralisée.
Les trois dimensions de la transparence de la distribution sont -
- Transparence de l'emplacement
- Transparence de la fragmentation
- Transparence de réplication
Transparence de l'emplacement
La transparence de l'emplacement garantit que l'utilisateur peut interroger sur n'importe quelle (s) table (s) ou fragment (s) d'une table comme s'ils étaient stockés localement sur le site de l'utilisateur. Le fait que la table ou ses fragments soient stockés sur un site distant dans le système de base de données distribué doit être complètement inconscient pour l'utilisateur final. L'adresse du ou des sites distants et les mécanismes d'accès sont complètement masqués.
Afin d'incorporer la transparence de l'emplacement, DDBMS doit avoir accès à un dictionnaire de données mis à jour et précis et à un répertoire DDBMS qui contient les détails des emplacements des données.
Transparence de la fragmentation
La transparence de la fragmentation permet aux utilisateurs d'interroger n'importe quelle table comme si elle n'était pas fragmentée. Ainsi, cela masque le fait que la table sur laquelle l'utilisateur interroge est en fait un fragment ou une union de certains fragments. Il cache également le fait que les fragments se trouvent sur divers sites.
Ceci est quelque peu similaire aux utilisateurs de vues SQL, où l'utilisateur peut ne pas savoir qu'il utilise une vue d'une table au lieu de la table elle-même.
Transparence de réplication
La transparence de la réplication garantit que la réplication des bases de données est masquée aux utilisateurs. Il permet aux utilisateurs d'interroger une table comme s'il n'existait qu'une seule copie de la table.
La transparence de la réplication est associée à la transparence de la concurrence et à la transparence des échecs. Chaque fois qu'un utilisateur met à jour un élément de données, la mise à jour est reflétée dans toutes les copies de la table. Cependant, cette opération ne doit pas être connue de l'utilisateur. C'est la transparence de la concurrence. Aussi, en cas de défaillance d'un site, l'utilisateur peut toujours procéder à ses requêtes à l'aide de copies répliquées sans aucune connaissance de défaillance. C'est la transparence de l'échec.
Combinaison de transparents
Dans tout système de base de données distribué, le concepteur doit s'assurer que toutes les transparences indiquées sont maintenues dans une large mesure. Le concepteur peut choisir de fragmenter les tables, de les répliquer et de les stocker sur différents sites; tous inconscients de l'utilisateur final. Cependant, une transparence totale de la distribution est une tâche difficile et nécessite des efforts de conception considérables.
Le contrôle de base de données fait référence à la tâche de faire appliquer les réglementations afin de fournir des données correctes aux utilisateurs authentiques et aux applications d'une base de données. Afin que des données correctes soient disponibles pour les utilisateurs, toutes les données doivent être conformes aux contraintes d'intégrité définies dans la base de données. En outre, les données devraient être exclues des utilisateurs non autorisés afin de maintenir la sécurité et la confidentialité de la base de données. Le contrôle de la base de données est l'une des tâches principales de l'administrateur de base de données (DBA).
Les trois dimensions du contrôle de base de données sont:
- Authentication
- Des droits d'accès
- Contraintes d'intégrité
Authentification
Dans un système de base de données distribué, l'authentification est le processus par lequel seuls les utilisateurs légitimes peuvent accéder aux ressources de données.
L'authentification peut être appliquée à deux niveaux -
Controlling Access to Client Computer- À ce niveau, l'accès des utilisateurs est restreint lors de la connexion à l'ordinateur client qui fournit une interface utilisateur au serveur de base de données. La méthode la plus courante est une combinaison nom d'utilisateur / mot de passe. Cependant, des méthodes plus sophistiquées comme l'authentification biométrique peuvent être utilisées pour les données de haute sécurité.
Controlling Access to the Database Software- À ce niveau, le logiciel / l'administrateur de la base de données attribue des informations d'identification à l'utilisateur. L'utilisateur accède à la base de données à l'aide de ces informations d'identification. L'une des méthodes consiste à créer un compte de connexion dans le serveur de base de données.
Des droits d'accès
Les droits d'accès d'un utilisateur font référence aux privilèges accordés à l'utilisateur concernant les opérations du SGBD, tels que les droits de créer une table, de supprimer une table, d'ajouter / supprimer / mettre à jour des tuples dans une table ou d'interroger sur la table.
Dans les environnements distribués, étant donné qu'il existe un grand nombre de tables et un plus grand nombre d'utilisateurs, il n'est pas possible d'attribuer des droits d'accès individuels aux utilisateurs. Ainsi, DDBMS définit certains rôles. Un rôle est une construction avec certains privilèges dans un système de base de données. Une fois les différents rôles définis, les utilisateurs individuels se voient attribuer l'un de ces rôles. Souvent, une hiérarchie de rôles est définie en fonction de la hiérarchie d'autorité et de responsabilité de l'organisation.
Par exemple, les instructions SQL suivantes créent un rôle «Comptable», puis attribuent ce rôle à l'utilisateur «ABC».
CREATE ROLE ACCOUNTANT;
GRANT SELECT, INSERT, UPDATE ON EMP_SAL TO ACCOUNTANT;
GRANT INSERT, UPDATE, DELETE ON TENDER TO ACCOUNTANT;
GRANT INSERT, SELECT ON EXPENSE TO ACCOUNTANT;
COMMIT;
GRANT ACCOUNTANT TO ABC;
COMMIT;
Contrôle de l'intégrité sémantique
Le contrôle d'intégrité sémantique définit et applique les contraintes d'intégrité du système de base de données.
Les contraintes d'intégrité sont les suivantes -
- Contrainte d'intégrité du type de données
- Contrainte d'intégrité d'entité
- Contrainte d'intégrité référentielle
Contrainte d'intégrité du type de données
Une contrainte de type de données restreint la plage de valeurs et le type d'opérations qui peuvent être appliquées au champ avec le type de données spécifié.
Par exemple, considérons qu'une table "HOSTEL" a trois champs - le numéro de l'auberge, le nom de l'auberge et la capacité. Le numéro de l'auberge doit commencer par la lettre majuscule "H" et ne peut pas être NULL, et la capacité ne doit pas être supérieure à 150. La commande SQL suivante peut être utilisée pour la définition des données -
CREATE TABLE HOSTEL (
H_NO VARCHAR2(5) NOT NULL,
H_NAME VARCHAR2(15),
CAPACITY INTEGER,
CHECK ( H_NO LIKE 'H%'),
CHECK ( CAPACITY <= 150)
);
Contrôle de l'intégrité des entités
Le contrôle d'intégrité de l'entité applique les règles afin que chaque tuple puisse être identifié de manière unique à partir d'autres tuples. Pour cela, une clé primaire est définie. Une clé primaire est un ensemble de champs minimaux qui peuvent identifier de manière unique un tuple. La contrainte d'intégrité d'entité indique que deux tuples dans une table ne peuvent pas avoir de valeurs identiques pour les clés primaires et qu'aucun champ faisant partie de la clé primaire ne peut avoir une valeur NULL.
Par exemple, dans le tableau d'auberge ci-dessus, le numéro d'auberge peut être attribué comme clé primaire via l'instruction SQL suivante (en ignorant les vérifications) -
CREATE TABLE HOSTEL (
H_NO VARCHAR2(5) PRIMARY KEY,
H_NAME VARCHAR2(15),
CAPACITY INTEGER
);
Contrainte d'intégrité référentielle
La contrainte d'intégrité référentielle définit les règles des clés étrangères. Une clé étrangère est un champ dans une table de données qui est la clé primaire d'une table associée. La contrainte d'intégrité référentielle établit la règle selon laquelle la valeur du champ de clé étrangère doit soit être parmi les valeurs de la clé primaire de la table référencée, soit être entièrement NULL.
Par exemple, considérons une table d'étudiant où un étudiant peut choisir de vivre dans une auberge. Pour inclure cela, la clé primaire de la table hostel doit être incluse en tant que clé étrangère dans la table student. L'instruction SQL suivante incorpore ceci -
CREATE TABLE STUDENT (
S_ROLL INTEGER PRIMARY KEY,
S_NAME VARCHAR2(25) NOT NULL,
S_COURSE VARCHAR2(10),
S_HOSTEL VARCHAR2(5) REFERENCES HOSTEL
);
Lorsqu'une requête est placée, elle est d'abord analysée, analysée et validée. Une représentation interne de la requête est alors créée, telle qu'une arborescence de requêtes ou un graphe de requête. Ensuite, des stratégies d'exécution alternatives sont conçues pour récupérer les résultats des tables de la base de données. Le processus de choix de la stratégie d'exécution la plus appropriée pour le traitement des requêtes est appelé optimisation des requêtes.
Problèmes d'optimisation des requêtes dans DDBMS
Dans DDBMS, l'optimisation des requêtes est une tâche cruciale. La complexité est élevée car le nombre de stratégies alternatives peut augmenter de manière exponentielle en raison des facteurs suivants -
- La présence d'un certain nombre de fragments.
- Répartition des fragments ou des tables sur différents sites.
- La vitesse des liens de communication.
- Disparité dans les capacités de traitement local.
Par conséquent, dans un système distribué, l'objectif est souvent de trouver une bonne stratégie d'exécution pour le traitement des requêtes plutôt que la meilleure. Le temps d'exécution d'une requête est la somme des éléments suivants:
- Il est temps de communiquer les requêtes aux bases de données.
- Il est temps d'exécuter des fragments de requête locaux.
- Il est temps de rassembler les données de différents sites.
- Il est temps d'afficher les résultats dans l'application.
Traitement des requêtes
Le traitement des requêtes est un ensemble de toutes les activités allant du placement de la requête à l'affichage des résultats de la requête. Les étapes sont comme indiqué dans le diagramme suivant -
Algèbre relationnelle
L'algèbre relationnelle définit l'ensemble des opérations de base du modèle de base de données relationnelle. Une séquence d'opérations d'algèbre relationnelle forme une expression d'algèbre relationnelle. Le résultat de cette expression représente le résultat d'une requête de base de données.
Les opérations de base sont -
- Projection
- Selection
- Union
- Intersection
- Minus
- Join
Projection
L'opération de projection affiche un sous-ensemble de champs d'une table. Cela donne une partition verticale de la table.
Syntax in Relational Algebra
$$ \ pi _ {<{AttributeList}>} {(<{Table Name}>)} $$
Par exemple, considérons la base de données des étudiants suivante -
|
||||
Roll_No | Name | Course | Semester | Gender |
2 | Amit Prasad | BCA | 1 | Masculin |
4 | Varsha Tiwari | BCA | 1 | Femme |
5 | Asif Ali | MCA | 2 | Masculin |
6 | Joe Wallace | MCA | 1 | Masculin |
8 | Shivani Iyengar | BCA | 1 | Femme |
Si nous voulons afficher les noms et les cours de tous les étudiants, nous utiliserons l'expression d'algèbre relationnelle suivante -
$$\pi_{Name,Course}{(STUDENT)}$$
Sélection
L'opération de sélection affiche un sous-ensemble de tuples d'une table qui satisfait certaines conditions. Cela donne une partition horizontale de la table.
Syntax in Relational Algebra
$$ \ sigma _ {<{Conditions}>} {(<{Nom de la table}>)} $$
Par exemple, dans le tableau Student, si nous voulons afficher les détails de tous les étudiants qui ont opté pour le cours MCA, nous utiliserons l'expression d'algèbre relationnelle suivante -
$$\sigma_{Course} = {\small "BCA"}^{(STUDENT)}$$
Combinaison d'opérations de projection et de sélection
Pour la plupart des requêtes, nous avons besoin d'une combinaison d'opérations de projection et de sélection. Il existe deux façons d'écrire ces expressions -
- Utilisation d'une séquence d'opérations de projection et de sélection.
- Utilisation de l'opération de changement de nom pour générer des résultats intermédiaires.
Par exemple, pour afficher les noms de toutes les étudiantes du cours BCA -
- Expression d'algèbre relationnelle à l'aide d'une séquence d'opérations de projection et de sélection
$$\pi_{Name}(\sigma_{Gender = \small "Female" AND \: Course = \small "BCA"}{(STUDENT)})$$
- Expression d'algèbre relationnelle à l'aide de l'opération de changement de nom pour générer des résultats intermédiaires
$$FemaleBCAStudent \leftarrow \sigma_{Gender = \small "Female" AND \: Course = \small "BCA"} {(STUDENT)}$$
$$Result \leftarrow \pi_{Name}{(FemaleBCAStudent)}$$
syndicat
Si P est le résultat d'une opération et Q est le résultat d'une autre opération, l'union de P et Q ($p \cup Q$) est l'ensemble de tous les tuples qui sont soit dans P, soit dans Q ou dans les deux sans doublons.
Par exemple, pour afficher tous les étudiants qui sont au semestre 1 ou qui suivent un cours BCA -
$$Sem1Student \leftarrow \sigma_{Semester = 1}{(STUDENT)}$$
$$BCAStudent \leftarrow \sigma_{Course = \small "BCA"}{(STUDENT)}$$
$$Result \leftarrow Sem1Student \cup BCAStudent$$
Intersection
Si P est le résultat d'une opération et Q est le résultat d'une autre opération, l'intersection de P et Q ( $p \cap Q$ ) est l'ensemble de tous les tuples qui sont tous les deux dans P et Q.
Par exemple, étant donné les deux schémas suivants -
EMPLOYEE
EmpID | Nom | Ville | département | Un salaire |
PROJECT
PId | Ville | département | Statut |
Pour afficher les noms de toutes les villes où se trouve un projet et où réside également un employé -
$$CityEmp \leftarrow \pi_{City}{(EMPLOYEE)}$$
$$CityProject \leftarrow \pi_{City}{(PROJECT)}$$
$$Result \leftarrow CityEmp \cap CityProject$$
Moins
Si P est le résultat d'une opération et Q est le résultat d'une autre opération, P - Q est l'ensemble de tous les tuples qui sont dans P et non dans Q.
Par exemple, pour lister tous les départements qui n'ont pas de projet en cours (projets avec statut = en cours) -
$$AllDept \leftarrow \pi_{Department}{(EMPLOYEE)}$$
$$ProjectDept \leftarrow \pi_{Department} (\sigma_{Status = \small "ongoing"}{(PROJECT)})$$
$$Result \leftarrow AllDept - ProjectDept$$
Joindre
L'opération de jointure combine des tuples liés de deux tables différentes (résultats de requêtes) en une seule table.
Par exemple, considérons deux schémas, Client et Succursale dans une base de données bancaire comme suit -
CUSTOMER
CustID | AccNo | TypeOfAc | ID de branche | DateOfOuverture |
BRANCH
ID de branche | Nom de la filiale | IFSCcode | Adresse |
Pour lister les détails de l'employé avec les détails de la succursale -
$$Result \leftarrow CUSTOMER \bowtie_{Customer.BranchID=Branch.BranchID}{BRANCH}$$
Traduire des requêtes SQL en algèbre relationnelle
Les requêtes SQL sont traduites en expressions d'algèbre relationnelle équivalentes avant l'optimisation. Une requête est d'abord décomposée en blocs de requête plus petits. Ces blocs sont traduits en expressions d'algèbre relationnelle équivalentes. L'optimisation comprend l'optimisation de chaque bloc, puis l'optimisation de la requête dans son ensemble.
Exemples
Considérons les schémas suivants -
EMPLOYÉ
EmpID | Nom | Ville | département | Un salaire |
PROJET
PId | Ville | département | Statut |
TRAVAUX
EmpID | PID | Heures |
Exemple 1
Pour afficher les détails de tous les employés qui gagnent un salaire MOINS que le salaire moyen, nous écrivons la requête SQL -
SELECT * FROM EMPLOYEE
WHERE SALARY < ( SELECT AVERAGE(SALARY) FROM EMPLOYEE ) ;
Cette requête contient une sous-requête imbriquée. Donc, cela peut être divisé en deux blocs.
Le bloc intérieur est -
SELECT AVERAGE(SALARY)FROM EMPLOYEE ;
Si le résultat de cette requête est AvgSal, alors le bloc externe est -
SELECT * FROM EMPLOYEE WHERE SALARY < AvgSal;
Expression d'algèbre relationnelle pour le bloc interne -
$$AvgSal \leftarrow \Im_{AVERAGE(Salary)}{EMPLOYEE}$$
Expression d'algèbre relationnelle pour le bloc externe -
$$ \ sigma_ {Salaire <{AvgSal}>} {EMPLOYEE} $$
Exemple 2
Pour afficher l'ID de projet et le statut de tous les projets de l'employé 'Arun Kumar', nous écrivons la requête SQL -
SELECT PID, STATUS FROM PROJECT
WHERE PID = ( SELECT FROM WORKS WHERE EMPID = ( SELECT EMPID FROM EMPLOYEE
WHERE NAME = 'ARUN KUMAR'));
Cette requête contient deux sous-requêtes imbriquées. Ainsi, peut être décomposé en trois blocs, comme suit -
SELECT EMPID FROM EMPLOYEE WHERE NAME = 'ARUN KUMAR';
SELECT PID FROM WORKS WHERE EMPID = ArunEmpID;
SELECT PID, STATUS FROM PROJECT WHERE PID = ArunPID;
(Ici, ArunEmpID et ArunPID sont les résultats de requêtes internes)
Les expressions d'algèbre relationnelle pour les trois blocs sont -
$$ArunEmpID \leftarrow \pi_{EmpID}(\sigma_{Name = \small "Arun Kumar"} {(EMPLOYEE)})$$
$$ArunPID \leftarrow \pi_{PID}(\sigma_{EmpID = \small "ArunEmpID"} {(WORKS)})$$
$$Result \leftarrow \pi_{PID, Status}(\sigma_{PID = \small "ArunPID"} {(PROJECT)})$$
Calcul des opérateurs d'algèbre relationnelle
Le calcul des opérateurs d'algèbre relationnelle peut être effectué de différentes manières, et chaque alternative est appelée access path.
L'alternative de calcul dépend de trois facteurs principaux -
- Type d'opérateur
- Mémoire disponible
- Structures de disque
Le temps d'exécution d'une opération d'algèbre relationnelle est la somme de -
- Il est temps de traiter les tuples.
- Il est temps de récupérer les tuples de la table du disque vers la mémoire.
Étant donné que le temps de traitement d'un tuple est beaucoup plus court que le temps de récupération du tuple à partir du stockage, en particulier dans un système distribué, l'accès au disque est très souvent considéré comme la métrique pour calculer le coût de l'expression relationnelle.
Calcul de la sélection
Le calcul de l'opération de sélection dépend de la complexité de la condition de sélection et de la disponibilité d'index sur les attributs de la table.
Voici les alternatives de calcul en fonction des index -
No Index- Si la table n'est pas triée et n'a pas d'index, le processus de sélection implique l'analyse de tous les blocs de disque de la table. Chaque bloc est mis en mémoire et chaque tuple du bloc est examiné pour voir s'il satisfait à la condition de sélection. Si la condition est satisfaite, elle est affichée comme sortie. C'est l'approche la plus coûteuse puisque chaque tuple est mis en mémoire et chaque tuple est traité.
B+ Tree Index- La plupart des systèmes de base de données sont construits sur l'index B + Tree. Si la condition de sélection est basée sur le champ, qui est la clé de cet index B + Tree, alors cet index est utilisé pour récupérer les résultats. Cependant, le traitement des instructions de sélection avec des conditions complexes peut impliquer un plus grand nombre d'accès aux blocs de disque et, dans certains cas, une analyse complète de la table.
Hash Index- Si des index de hachage sont utilisés et que son champ clé est utilisé dans la condition de sélection, la récupération des tuples à l'aide de l'index de hachage devient un processus simple. Un index de hachage utilise une fonction de hachage pour trouver l'adresse d'un compartiment dans lequel la valeur de clé correspondant à la valeur de hachage est stockée. Afin de trouver une valeur de clé dans l'index, la fonction de hachage est exécutée et l'adresse du compartiment est trouvée. Les valeurs de clé du bucket sont recherchées. Si une correspondance est trouvée, le tuple réel est extrait du bloc de disque dans la mémoire.
Calcul des jointures
Lorsque nous voulons joindre deux tables, disons P et Q, chaque tuple de P doit être comparé à chaque tuple de Q pour tester si la condition de jointure est satisfaite. Si la condition est satisfaite, les tuples correspondants sont concaténés, éliminant les champs en double et ajoutés à la relation de résultat. C'est donc l'opération la plus coûteuse.
Les approches courantes pour le calcul des jointures sont:
Approche en boucle imbriquée
C'est l'approche de jointure conventionnelle. Il peut être illustré par le pseudocode suivant (Tables P et Q, avec les tuples tuple_p et tuple_q et l'attribut de jointure a) -
For each tuple_p in P
For each tuple_q in Q
If tuple_p.a = tuple_q.a Then
Concatenate tuple_p and tuple_q and append to Result
End If
Next tuple_q
Next tuple-p
Approche de tri-fusion
Dans cette approche, les deux tables sont triées individuellement en fonction de l'attribut de jointure, puis les tables triées sont fusionnées. Des techniques de tri externe sont adoptées car le nombre d'enregistrements est très élevé et ne peut pas être logé dans la mémoire. Une fois que les tables individuelles sont triées, une page de chacune des tables triées est mise en mémoire, fusionnée en fonction de l'attribut de jointure et les tuples joints sont écrits.
Approche par hachage
Cette approche comprend deux phases: la phase de partitionnement et la phase de sondage. En phase de partitionnement, les tables P et Q sont divisées en deux ensembles de partitions disjointes. Une fonction de hachage commune est décidée. Cette fonction de hachage est utilisée pour affecter des tuples aux partitions. Dans la phase de sondage, les tuples d'une partition de P sont comparés aux tuples de la partition correspondante de Q. S'ils correspondent, alors ils sont écrits.
Une fois que les chemins d'accès alternatifs pour le calcul d'une expression d'algèbre relationnelle sont dérivés, le chemin d'accès optimal est déterminé. Dans ce chapitre, nous examinerons l'optimisation des requêtes dans un système centralisé tandis que dans le prochain chapitre, nous étudierons l'optimisation des requêtes dans un système distribué.
Dans un système centralisé, le traitement des requêtes est effectué dans le but suivant -
Minimisation du temps de réponse de la requête (temps nécessaire pour produire les résultats à la requête de l'utilisateur).
Maximisez le débit du système (le nombre de demandes traitées dans un laps de temps donné).
Réduisez la quantité de mémoire et de stockage requise pour le traitement.
Augmentez le parallélisme.
Analyse et traduction des requêtes
Initialement, la requête SQL est analysée. Ensuite, il est analysé pour rechercher les erreurs syntaxiques et l'exactitude des types de données. Si la requête réussit cette étape, la requête est décomposée en blocs de requête plus petits. Chaque bloc est ensuite traduit en une expression d'algèbre relationnelle équivalente.
Étapes d'optimisation des requêtes
L'optimisation des requêtes implique trois étapes, à savoir la génération d'arborescence de requêtes, la génération de plan et la génération de code de plan de requête.
Step 1 − Query Tree Generation
Un arbre de requête est une structure de données arborescente représentant une expression d'algèbre relationnelle. Les tables de la requête sont représentées sous forme de nœuds feuilles. Les opérations d'algèbre relationnelle sont représentées comme les nœuds internes. La racine représente la requête dans son ensemble.
Pendant l'exécution, un nœud interne est exécuté chaque fois que ses tables d'opérandes sont disponibles. Le nœud est ensuite remplacé par la table de résultats. Ce processus se poursuit pour tous les nœuds internes jusqu'à ce que le nœud racine soit exécuté et remplacé par la table de résultats.
Par exemple, considérons les schémas suivants -
EMPLOYÉ
EmpID | EName | Un salaire | DépartementNon | Date d'adhésion |
DÉPARTEMENT
DNo | DNom | Emplacement |
Exemple 1
Considérons la requête comme suit.
$$\pi_{EmpID} (\sigma_{EName = \small "ArunKumar"} {(EMPLOYEE)})$$
L'arbre de requête correspondant sera -
Exemple 2
Considérons une autre requête impliquant une jointure.
$\pi_{EName, Salary} (\sigma_{DName = \small "Marketing"} {(DEPARTMENT)}) \bowtie_{DNo=DeptNo}{(EMPLOYEE)}$
Voici l'arborescence des requêtes pour la requête ci-dessus.
Step 2 − Query Plan Generation
Une fois l'arborescence de requêtes générée, un plan de requête est créé. Un plan de requête est une arborescence de requêtes étendue qui comprend des chemins d'accès pour toutes les opérations de l'arborescence de requêtes. Les chemins d'accès spécifient comment les opérations relationnelles dans l'arborescence doivent être effectuées. Par exemple, une opération de sélection peut avoir un chemin d'accès qui donne des détails sur l'utilisation de l'index d'arborescence B + pour la sélection.
En outre, un plan de requête indique également comment les tables intermédiaires doivent être passées d'un opérateur à l'autre, comment les tables temporaires doivent être utilisées et comment les opérations doivent être pipelinées / combinées.
Step 3− Code Generation
La génération de code est la dernière étape de l'optimisation des requêtes. Il s'agit de la forme exécutable de la requête, dont la forme dépend du type du système d'exploitation sous-jacent. Une fois le code de requête généré, le gestionnaire d'exécution l'exécute et produit les résultats.
Approches de l'optimisation des requêtes
Parmi les approches d'optimisation des requêtes, la recherche exhaustive et les algorithmes basés sur l'heuristique sont principalement utilisés.
Optimisation complète de la recherche
Dans ces techniques, pour une requête, tous les plans de requête possibles sont initialement générés, puis le meilleur plan est sélectionné. Bien que ces techniques fournissent la meilleure solution, elles présentent une complexité temporelle et spatiale exponentielle en raison du grand espace de solution. Par exemple, technique de programmation dynamique.
Optimisation heuristique
L'optimisation heuristique utilise des approches d'optimisation basées sur des règles pour l'optimisation des requêtes. Ces algorithmes ont une complexité polynomiale dans le temps et dans l'espace, qui est inférieure à la complexité exponentielle des algorithmes basés sur la recherche exhaustive. Cependant, ces algorithmes ne produisent pas nécessairement le meilleur plan de requête.
Certaines des règles heuristiques courantes sont -
Effectuez les opérations de sélection et de projet avant les opérations de jointure. Cela se fait en déplaçant les opérations de sélection et de projet vers le bas de l'arborescence des requêtes. Cela réduit le nombre de tuples disponibles pour la jointure.
Effectuez les opérations de sélection / projet les plus restrictives avant les autres opérations.
Évitez les opérations croisées car elles donnent lieu à des tables intermédiaires de très grande taille.
Ce chapitre traite de l'optimisation des requêtes dans un système de base de données distribué.
Architecture de traitement distribué des requêtes
Dans un système de base de données distribué, le traitement d'une requête comprend une optimisation à la fois au niveau global et au niveau local. La requête entre dans le système de base de données sur le client ou le site de contrôle. Ici, l'utilisateur est validé, la requête est vérifiée, traduite et optimisée au niveau global.
L'architecture peut être représentée comme -
Mappage de requêtes globales dans des requêtes locales
Le processus de mappage des requêtes globales sur les requêtes locales peut être réalisé comme suit -
Les tables requises dans une requête globale ont des fragments répartis sur plusieurs sites. Les bases de données locales contiennent des informations uniquement sur les données locales. Le site de contrôle utilise le dictionnaire de données global pour collecter des informations sur la distribution et reconstruit la vue globale à partir des fragments.
S'il n'y a pas de réplication, l'optimiseur global exécute des requêtes locales sur les sites où les fragments sont stockés. S'il y a réplication, l'optimiseur global sélectionne le site en fonction du coût de communication, de la charge de travail et de la vitesse du serveur.
L'optimiseur global génère un plan d'exécution distribué afin que le moins de transfert de données se produise sur les sites. Le plan indique l'emplacement des fragments, l'ordre dans lequel les étapes de requête doivent être exécutées et les processus impliqués dans le transfert des résultats intermédiaires.
Les requêtes locales sont optimisées par les serveurs de base de données locaux. Enfin, les résultats de la requête locale sont fusionnés par une opération d'union dans le cas de fragments horizontaux et une opération de jointure pour les fragments verticaux.
Par exemple, considérons que le schéma de projet suivant est fragmenté horizontalement selon la ville, les villes étant New Delhi, Kolkata et Hyderabad.
PROJET
PId | Ville | département | Statut |
Supposons qu'il y ait une requête pour récupérer les détails de tous les projets dont le statut est «En cours».
La requête globale sera & inus;
$$\sigma_{status} = {\small "ongoing"}^{(PROJECT)}$$
La requête sur le serveur de New Delhi sera -
$$\sigma_{status} = {\small "ongoing"}^{({NewD}_-{PROJECT})}$$
La requête sur le serveur de Kolkata sera -
$$\sigma_{status} = {\small "ongoing"}^{({Kol}_-{PROJECT})}$$
La requête sur le serveur d'Hyderabad sera -
$$\sigma_{status} = {\small "ongoing"}^{({Hyd}_-{PROJECT})}$$
Afin d'obtenir le résultat global, nous devons unir les résultats des trois requêtes comme suit -
$\sigma_{status} = {\small "ongoing"}^{({NewD}_-{PROJECT})} \cup \sigma_{status} = {\small "ongoing"}^{({kol}_-{PROJECT})} \cup \sigma_{status} = {\small "ongoing"}^{({Hyd}_-{PROJECT})}$
Optimisation des requêtes distribuées
L'optimisation des requêtes distribuées nécessite l'évaluation d'un grand nombre d'arborescences de requêtes dont chacune produit les résultats requis d'une requête. Cela est principalement dû à la présence d'une grande quantité de données répliquées et fragmentées. Par conséquent, l'objectif est de trouver une solution optimale au lieu de la meilleure solution.
Les principaux problèmes liés à l'optimisation des requêtes distribuées sont:
- Utilisation optimale des ressources dans le système distribué.
- Trading de requêtes.
- Réduction de l'espace de solution de la requête.
Utilisation optimale des ressources dans le système distribué
Un système distribué a un certain nombre de serveurs de base de données dans les différents sites pour effectuer les opérations relatives à une requête. Voici les approches pour une utilisation optimale des ressources -
Operation Shipping- En opération expédition, l'opération est exécutée sur le site où les données sont stockées et non sur le site client. Les résultats sont ensuite transférés sur le site client. Ceci est approprié pour les opérations où les opérandes sont disponibles sur le même site. Exemple: Opérations de sélection et de projet.
Data Shipping- Lors de l'envoi de données, les fragments de données sont transférés vers le serveur de base de données, où les opérations sont exécutées. Ceci est utilisé dans les opérations où les opérandes sont distribués sur différents sites. Ceci est également approprié dans les systèmes où les coûts de communication sont faibles et où les processeurs locaux sont beaucoup plus lents que le serveur client.
Hybrid Shipping- Il s'agit d'une combinaison de données et d'opérations d'expédition. Ici, les fragments de données sont transférés vers les processeurs à grande vitesse, où l'opération s'exécute. Les résultats sont ensuite envoyés au site client.
Trading de requêtes
Dans l'algorithme d'échange de requêtes pour les systèmes de bases de données distribuées, le site de contrôle / client pour une requête distribuée est appelé l'acheteur et les sites sur lesquels les requêtes locales s'exécutent sont appelés vendeurs. L'acheteur formule un certain nombre d'alternatives pour choisir les vendeurs et pour reconstruire les résultats globaux. L'objectif de l'acheteur est d'atteindre le coût optimal.
L'algorithme commence par l'attribution de sous-requêtes par l'acheteur aux sites du vendeur. Le plan optimal est créé à partir des plans de requêtes optimisés locaux proposés par les vendeurs combinés avec le coût de communication pour la reconstruction du résultat final. Une fois le plan optimal global formulé, la requête est exécutée.
Réduction de l'espace solution de la requête
Une solution optimale implique généralement une réduction de l'espace de la solution afin de réduire le coût des requêtes et du transfert de données. Ceci peut être réalisé grâce à un ensemble de règles heuristiques, tout comme l'heuristique dans les systèmes centralisés.
Voici quelques-unes des règles -
Effectuer les opérations de sélection et de projection le plus tôt possible. Cela réduit le flux de données sur le réseau de communication.
Simplifiez les opérations sur les fragments horizontaux en éliminant les conditions de sélection qui ne sont pas pertinentes pour un site particulier.
En cas d'opérations d'adhésion et d'union comprenant des fragments situés sur plusieurs sites, transférez les données fragmentées vers le site où la plupart des données sont présentes et effectuez l'opération là-bas.
Utilisez l'opération de semi-jointure pour qualifier les tuples à joindre. Cela réduit la quantité de transfert de données qui à son tour réduit les coûts de communication.
Fusionnez les feuilles et les sous-arbres communs dans une arborescence de requêtes distribuée.
Ce chapitre traite des différents aspects du traitement des transactions. Nous étudierons également les tâches de bas niveau incluses dans une transaction, les états de transaction et les propriétés d'une transaction. Dans la dernière partie, nous examinerons les horaires et la sérialisabilité des horaires.
Transactions
Une transaction est un programme comprenant une collection d'opérations de base de données, exécutée comme une unité logique de traitement de données. Les opérations effectuées dans une transaction comprennent une ou plusieurs opérations de base de données telles que l'insertion, la suppression, la mise à jour ou la récupération de données. C'est un processus atomique qui est soit exécuté en totalité ou qui n'est pas exécuté du tout. Une transaction impliquant uniquement la récupération de données sans aucune mise à jour des données est appelée transaction en lecture seule.
Chaque opération de haut niveau peut être divisée en un certain nombre de tâches ou d'opérations de bas niveau. Par exemple, une opération de mise à jour des données peut être divisée en trois tâches -
read_item() - lit l'élément de données du stockage vers la mémoire principale.
modify_item() - changer la valeur de l'élément dans la mémoire principale.
write_item() - écrire la valeur modifiée de la mémoire principale vers le stockage.
L'accès à la base de données est limité aux opérations read_item () et write_item (). De même, pour toutes les transactions, la lecture et l'écriture forment les opérations de base de la base de données.
Opérations de transaction
Les opérations de bas niveau effectuées dans une transaction sont -
begin_transaction - Un marqueur qui spécifie le début de l'exécution de la transaction.
read_item or write_item - Opérations de base de données qui peuvent être entrelacées avec des opérations de mémoire principale dans le cadre d'une transaction.
end_transaction - Un marqueur qui spécifie la fin de la transaction.
commit - Un signal pour spécifier que la transaction a été complétée avec succès dans son intégralité et ne sera pas annulée.
rollback- Un signal pour indiquer que la transaction a échoué et que toutes les modifications temporaires de la base de données sont annulées. Une transaction validée ne peut pas être annulée.
États de transaction
Une transaction peut passer par un sous-ensemble de cinq états, active, partiellement validée, validée, échouée et abandonnée.
Active- L'état initial dans lequel la transaction entre est l'état actif. La transaction reste dans cet état pendant qu'elle exécute des opérations de lecture, d'écriture ou d'autres opérations.
Partially Committed - La transaction entre dans cet état après l'exécution de la dernière instruction de la transaction.
Committed - La transaction entre dans cet état après la réussite de la transaction et les vérifications du système ont émis un signal de validation.
Failed - La transaction passe de l'état partiellement engagé ou actif à l'état d'échec lorsqu'il est découvert que l'exécution normale ne peut plus se poursuivre ou que les vérifications du système échouent.
Aborted - Il s'agit de l'état après que la transaction a été annulée après l'échec et que la base de données a été restaurée à son état qui était avant le début de la transaction.
Le diagramme de transition d'état suivant décrit les états de la transaction et les opérations de transaction de bas niveau qui provoquent un changement d'état.
Propriétés souhaitables des transactions
Toute transaction doit conserver les propriétés ACID, à savoir. Atomicité, cohérence, isolation et durabilité.
Atomicity- Cette propriété indique qu'une transaction est une unité atomique de traitement, c'est-à-dire qu'elle est effectuée dans son intégralité ou pas du tout. Aucune mise à jour partielle ne doit exister.
Consistency- Une transaction doit faire passer la base de données d'un état cohérent à un autre état cohérent. Il ne doit pas nuire aux éléments de données de la base de données.
Isolation- Une transaction doit être exécutée comme si elle était la seule du système. Il ne doit y avoir aucune interférence provenant des autres transactions simultanées qui s'exécutent simultanément.
Durability - Si une transaction validée entraîne une modification, cette modification doit être durable dans la base de données et non perdue en cas d'échec.
Horaires et conflits
Dans un système avec plusieurs transactions simultanées, un scheduleest l'ordre total d'exécution des opérations. Etant donné un horaire S comprenant n transactions, disons T1, T2, T3 ……… ..Tn; pour toute transaction Ti, les opérations en Ti doivent s'exécuter comme prévu dans le calendrier S.
Types d'horaires
Il existe deux types d'horaires -
Serial Schedules- Dans un programme en série, à tout moment, une seule transaction est active, c'est-à-dire qu'il n'y a pas de chevauchement des transactions. Ceci est illustré dans le graphique suivant -
Parallel Schedules- Dans les programmes parallèles, plusieurs transactions sont actives simultanément, c'est-à-dire que les transactions contiennent des opérations qui se chevauchent à la fois. Ceci est illustré dans le graphique suivant -
Conflits dans les horaires
Dans un calendrier comprenant plusieurs transactions, un conflictse produit lorsque deux transactions actives effectuent des opérations non compatibles. On dit que deux opérations sont en conflit, lorsque toutes les trois conditions suivantes existent simultanément -
Les deux opérations font partie de transactions différentes.
Les deux opérations accèdent au même élément de données.
Au moins une des opérations est une opération write_item (), c'est-à-dire qu'elle tente de modifier la donnée.
Sérialisabilité
UNE serializable schedulede «n» transactions est un programme parallèle qui équivaut à un programme en série comprenant les mêmes «n» transactions. Une planification sérialisable contient l'exactitude de la planification série tout en garantissant une meilleure utilisation du processeur de la planification parallèle.
Équivalence des annexes
L'équivalence de deux horaires peut être des types suivants -
Result equivalence - Deux tableaux produisant des résultats identiques sont dits équivalents.
View equivalence - Deux horaires qui exécutent une action similaire de manière similaire sont dits équivalents à la vue.
Conflict equivalence - Deux programmes sont dits équivalents en conflit si les deux contiennent le même ensemble de transactions et ont le même ordre de paires d'opérations en conflit.
Les techniques de contrôle de la concurrence garantissent que plusieurs transactions sont exécutées simultanément tout en conservant les propriétés ACID des transactions et la sérialisabilité dans les horaires.
Dans ce chapitre, nous étudierons les différentes approches de contrôle d'accès concurrentiel.
Protocoles de contrôle d'accès concurrentiel basés sur le verrouillage
Les protocoles de contrôle d'accès concurrentiel basés sur le verrouillage utilisent le concept de verrouillage des éléments de données. UNElockest une variable associée à un élément de données qui détermine si des opérations de lecture / écriture peuvent être effectuées sur cet élément de données. Généralement, une matrice de compatibilité de verrouillage est utilisée, qui indique si un élément de données peut être verrouillé par deux transactions en même temps.
Les systèmes de contrôle d'accès concurrentiel basés sur le verrouillage peuvent utiliser des protocoles de verrouillage monophasés ou biphasés.
Protocole de verrouillage monophasé
Dans cette méthode, chaque transaction verrouille un élément avant utilisation et libère le verrou dès qu'elle a fini de l'utiliser. Cette méthode de verrouillage offre une concurrence maximale mais n'impose pas toujours la sérialisation.
Protocole de verrouillage biphasé
Dans ce procédé, toutes les opérations de verrouillage précèdent la première opération de déverrouillage ou de déverrouillage. La transaction comprend deux phases. Dans la première phase, une transaction n'acquiert que tous les verrous dont elle a besoin et ne libère aucun verrou. C'est ce qu'on appelle l'expansion ou legrowing phase. Dans la deuxième phase, la transaction libère les verrous et ne peut pas demander de nouveaux verrous. C'est ce qu'on appelle leshrinking phase.
Chaque transaction qui suit le protocole de verrouillage en deux phases est garantie d'être sérialisable. Cependant, cette approche fournit un faible parallélisme entre deux transactions en conflit.
Algorithmes de contrôle de la concurrence d'horodatage
Les algorithmes de contrôle d'accès concurrentiel basés sur l'horodatage utilisent l'horodatage d'une transaction pour coordonner l'accès simultané à un élément de données afin d'assurer la sérialisation. Un horodatage est un identifiant unique donné par le SGBD à une transaction qui représente l'heure de début de la transaction.
Ces algorithmes garantissent que les transactions s'engagent dans l'ordre dicté par leur horodatage. Une transaction plus ancienne doit être validée avant une transaction plus jeune, car la transaction la plus ancienne entre dans le système avant la plus jeune.
Les techniques de contrôle d'accès concurrentiel basées sur l'horodatage génèrent des calendriers sérialisables de telle sorte que le programme en série équivalent est organisé par ordre d'âge des transactions participantes.
Certains des algorithmes de contrôle de concurrence basés sur l'horodatage sont -
- Algorithme de classement d'horodatage de base.
- Algorithme de classement d'horodatage conservateur.
- Algorithme de multiversion basé sur l'ordre d'horodatage.
L'ordre basé sur l'horodatage suit trois règles pour appliquer la sérialisabilité -
Access Rule- Lorsque deux transactions tentent d'accéder simultanément à la même donnée, pour les opérations conflictuelles, la priorité est donnée à la transaction plus ancienne. Cela oblige la transaction plus récente à attendre que la transaction plus ancienne soit validée en premier.
Late Transaction Rule- Si une transaction plus récente a écrit un élément de données, une transaction plus ancienne n'est pas autorisée à lire ou à écrire cet élément de données. Cette règle empêche la transaction plus ancienne de s'engager une fois la transaction plus récente déjà validée.
Younger Transaction Rule - Une transaction plus jeune peut lire ou écrire un élément de données qui a déjà été écrit par une transaction plus ancienne.
Algorithme de contrôle de concurrence optimiste
Dans les systèmes à faible taux de conflit, la tâche de validation de chaque transaction pour la sérialisabilité peut réduire les performances. Dans ces cas, le test de sérialisabilité est reporté juste avant la validation. Le taux de conflit étant faible, la probabilité d’annuler des transactions qui ne sont pas sérialisables est également faible. Cette approche est appelée technique de contrôle de concurrence optimiste.
Dans cette approche, le cycle de vie d'une transaction est divisé en trois phases:
Execution Phase - Une transaction récupère les éléments de données en mémoire et effectue des opérations sur eux.
Validation Phase - Une transaction effectue des vérifications pour s'assurer que la validation de ses modifications dans la base de données passe le test de sérialisabilité.
Commit Phase - Une transaction réécrit une donnée modifiée en mémoire sur le disque.
Cet algorithme utilise trois règles pour appliquer la sérialisation dans la phase de validation -
Rule 1- Étant donné deux transactions T i et T j , si T i lit la donnée que T j est en train d’écrire, alors la phase d’exécution de T i ne peut pas chevaucher la phase de validation de T j . T j ne peut s'engager qu'après la fin de l'exécution de T i .
Rule 2- Étant donné deux transactions T i et T j , si T i écrit la donnée que T j est en train de lire, alors la phase de validation de T i ne peut pas chevaucher la phase d’exécution de T j . T j ne peut commencer à s'exécuter qu'après que T i s'est déjà engagé.
Rule 3- Étant donné deux transactions T i et T j , si T i écrit la donnée que T j est également en train d’écrire, alors la phase de validation de T i ne peut pas chevaucher la phase de validation de T j . T j ne peut commencer à s'engager qu'après que T i s'est déjà engagé.
Contrôle de la concurrence dans les systèmes distribués
Dans cette section, nous verrons comment les techniques ci-dessus sont implémentées dans un système de base de données distribué.
Algorithme de verrouillage biphasé distribué
Le principe de base du verrouillage biphasé distribué est le même que le protocole de verrouillage biphasé de base. Cependant, dans un système distribué, il existe des sites désignés comme gestionnaires de serrures. Un gestionnaire de verrous contrôle les demandes d'acquisition de verrous des moniteurs de transaction. Afin de renforcer la coordination entre les gestionnaires de serrures dans divers sites, au moins un site est autorisé à voir toutes les transactions et à détecter les conflits de verrouillage.
Selon le nombre de sites capables de détecter les conflits de verrouillage, les approches de verrouillage en deux phases distribuées peuvent être de trois types:
Centralized two-phase locking- Dans cette approche, un site est désigné comme gestionnaire de la serrure centrale. Tous les sites de l'environnement connaissent l'emplacement du gestionnaire central de verrouillage et en obtiennent le verrouillage lors des transactions.
Primary copy two-phase locking- Dans cette approche, un certain nombre de sites sont désignés comme centres de contrôle des écluses. Chacun de ces sites a la responsabilité de gérer un ensemble défini de serrures. Tous les sites savent quel centre de contrôle de serrure est responsable de la gestion du verrouillage de quelle table de données / élément de fragment.
Distributed two-phase locking- Dans cette approche, il existe un certain nombre de gestionnaires de verrouillage, où chaque gestionnaire de verrouillage contrôle les verrous des éléments de données stockés sur son site local. L'emplacement du gestionnaire de verrouillage est basé sur la distribution et la réplication des données.
Contrôle de simultanéité d'horodatage distribué
Dans un système centralisé, l'horodatage de toute transaction est déterminé par la lecture de l'horloge physique. Mais, dans un système distribué, les lectures d'horloge physique / logique locale d'un site ne peuvent pas être utilisées comme horodatage global, car elles ne sont pas uniques au monde. Ainsi, un horodatage comprend une combinaison d'ID de site et de lecture d'horloge de ce site.
Pour mettre en œuvre des algorithmes de classement d'horodatage, chaque site dispose d'un planificateur qui gère une file d'attente distincte pour chaque gestionnaire de transactions. Lors de la transaction, un gestionnaire de transactions envoie une demande de verrouillage au planificateur du site. Le planificateur place la demande dans la file d'attente correspondante dans un ordre d'horodatage croissant. Les requêtes sont traitées depuis le début des files d'attente dans l'ordre de leurs horodatages, c'est-à-dire les plus anciennes en premier.
Graphiques de conflit
Une autre méthode consiste à créer des graphiques de conflit. Pour cette transaction, des classes sont définies. Une classe de transaction contient deux ensembles d'éléments de données appelés ensemble de lecture et ensemble d'écriture. Une transaction appartient à une classe particulière si l'ensemble de lecture de la transaction est un sous-ensemble de l'ensemble de lecture de la classe et que l'ensemble d'écriture de la transaction est un sous-ensemble de l'ensemble d'écriture de la classe. Dans la phase de lecture, chaque transaction émet ses demandes de lecture pour les éléments de données dans son ensemble de lecture. Dans la phase d'écriture, chaque transaction émet ses demandes d'écriture.
Un graphique de conflit est créé pour les classes auxquelles appartiennent les transactions actives. Celui-ci contient un ensemble d'arêtes verticales, horizontales et diagonales. Une arête verticale relie deux nœuds au sein d'une classe et dénote des conflits au sein de la classe. Un bord horizontal relie deux nœuds sur deux classes et dénote un conflit d'écriture-écriture entre différentes classes. Un bord diagonal relie deux nœuds à travers deux classes et dénote un conflit écriture-lecture ou lecture-écriture entre deux classes.
Les graphiques de conflit sont analysés pour déterminer si deux transactions au sein de la même classe ou entre deux classes différentes peuvent être exécutées en parallèle.
Algorithme de contrôle de concurrence optimiste distribué
L'algorithme de contrôle de concurrence optimiste distribué étend l'algorithme de contrôle de concurrence optimiste. Pour cette extension, deux règles sont appliquées -
Rule 1- Selon cette règle, une transaction doit être validée localement sur tous les sites lors de son exécution. Si une transaction s'avère invalide sur un site, elle est abandonnée. La validation locale garantit que la transaction maintient la sérialisabilité sur les sites où elle a été exécutée. Une fois qu'une transaction réussit le test de validation local, elle est validée globalement.
Rule 2- Selon cette règle, une fois qu'une transaction a réussi le test de validation local, elle doit être validée globalement. La validation globale garantit que si deux transactions en conflit s'exécutent ensemble sur plus d'un site, elles doivent s'engager dans le même ordre relatif sur tous les sites qu'elles exécutent ensemble. Cela peut nécessiter qu'une transaction attende l'autre transaction en conflit, après validation avant la validation. Cette exigence rend l'algorithme moins optimiste car une transaction peut ne pas être en mesure de s'engager dès qu'elle est validée sur un site.
Ce chapitre présente les mécanismes de gestion des interblocages dans les systèmes de base de données. Nous étudierons les mécanismes de gestion des blocages dans les systèmes de base de données centralisés et distribués.
Que sont les Deadlocks?
Le blocage est un état d'un système de base de données ayant deux transactions ou plus, lorsque chaque transaction attend un élément de données qui est verrouillé par une autre transaction. Un blocage peut être indiqué par un cycle dans le graphique d'attente. Il s'agit d'un graphe orienté dans lequel les sommets indiquent les transactions et les arêtes indiquent les attentes pour les éléments de données.
Par exemple, dans le graphique d'attente suivant, la transaction T1 attend la donnée X qui est verrouillée par T3. T3 attend Y qui est verrouillé par T2 et T2 attend Z qui est verrouillé par T1. Par conséquent, un cycle d'attente est formé et aucune des transactions ne peut continuer à s'exécuter.
Deadlock Handling in Centralized Systems
There are three classical approaches for deadlock handling, namely −
- Deadlock prevention.
- Deadlock avoidance.
- Deadlock detection and removal.
All of the three approaches can be incorporated in both a centralized and a distributed database system.
Deadlock Prevention
The deadlock prevention approach does not allow any transaction to acquire locks that will lead to deadlocks. The convention is that when more than one transactions request for locking the same data item, only one of them is granted the lock.
One of the most popular deadlock prevention methods is pre-acquisition of all the locks. In this method, a transaction acquires all the locks before starting to execute and retains the locks for the entire duration of transaction. If another transaction needs any of the already acquired locks, it has to wait until all the locks it needs are available. Using this approach, the system is prevented from being deadlocked since none of the waiting transactions are holding any lock.
Deadlock Avoidance
The deadlock avoidance approach handles deadlocks before they occur. It analyzes the transactions and the locks to determine whether or not waiting leads to a deadlock.
The method can be briefly stated as follows. Transactions start executing and request data items that they need to lock. The lock manager checks whether the lock is available. If it is available, the lock manager allocates the data item and the transaction acquires the lock. However, if the item is locked by some other transaction in incompatible mode, the lock manager runs an algorithm to test whether keeping the transaction in waiting state will cause a deadlock or not. Accordingly, the algorithm decides whether the transaction can wait or one of the transactions should be aborted.
There are two algorithms for this purpose, namely wait-die and wound-wait. Let us assume that there are two transactions, T1 and T2, where T1 tries to lock a data item which is already locked by T2. The algorithms are as follows −
Wait-Die − If T1 is older than T2, T1 is allowed to wait. Otherwise, if T1 is younger than T2, T1 is aborted and later restarted.
Wound-Wait − If T1 is older than T2, T2 is aborted and later restarted. Otherwise, if T1 is younger than T2, T1 is allowed to wait.
Deadlock Detection and Removal
The deadlock detection and removal approach runs a deadlock detection algorithm periodically and removes deadlock in case there is one. It does not check for deadlock when a transaction places a request for a lock. When a transaction requests a lock, the lock manager checks whether it is available. If it is available, the transaction is allowed to lock the data item; otherwise the transaction is allowed to wait.
Since there are no precautions while granting lock requests, some of the transactions may be deadlocked. To detect deadlocks, the lock manager periodically checks if the wait-forgraph has cycles. If the system is deadlocked, the lock manager chooses a victim transaction from each cycle. The victim is aborted and rolled back; and then restarted later. Some of the methods used for victim selection are −
- Choose the youngest transaction.
- Choose the transaction with fewest data items.
- Choose the transaction that has performed least number of updates.
- Choose the transaction having least restart overhead.
- Choose the transaction which is common to two or more cycles.
This approach is primarily suited for systems having transactions low and where fast response to lock requests is needed.
Deadlock Handling in Distributed Systems
Transaction processing in a distributed database system is also distributed, i.e. the same transaction may be processing at more than one site. The two main deadlock handling concerns in a distributed database system that are not present in a centralized system are transaction location and transaction control. Once these concerns are addressed, deadlocks are handled through any of deadlock prevention, deadlock avoidance or deadlock detection and removal.
Transaction Location
Transactions in a distributed database system are processed in multiple sites and use data items in multiple sites. The amount of data processing is not uniformly distributed among these sites. The time period of processing also varies. Thus the same transaction may be active at some sites and inactive at others. When two conflicting transactions are located in a site, it may happen that one of them is in inactive state. This condition does not arise in a centralized system. This concern is called transaction location issue.
This concern may be addressed by Daisy Chain model. In this model, a transaction carries certain details when it moves from one site to another. Some of the details are the list of tables required, the list of sites required, the list of visited tables and sites, the list of tables and sites that are yet to be visited and the list of acquired locks with types. After a transaction terminates by either commit or abort, the information should be sent to all the concerned sites.
Transaction Control
Transaction control is concerned with designating and controlling the sites required for processing a transaction in a distributed database system. There are many options regarding the choice of where to process the transaction and how to designate the center of control, like −
- One server may be selected as the center of control.
- The center of control may travel from one server to another.
- The responsibility of controlling may be shared by a number of servers.
Distributed Deadlock Prevention
Just like in centralized deadlock prevention, in distributed deadlock prevention approach, a transaction should acquire all the locks before starting to execute. This prevents deadlocks.
The site where the transaction enters is designated as the controlling site. The controlling site sends messages to the sites where the data items are located to lock the items. Then it waits for confirmation. When all the sites have confirmed that they have locked the data items, transaction starts. If any site or communication link fails, the transaction has to wait until they have been repaired.
Though the implementation is simple, this approach has some drawbacks −
Pre-acquisition of locks requires a long time for communication delays. This increases the time required for transaction.
In case of site or link failure, a transaction has to wait for a long time so that the sites recover. Meanwhile, in the running sites, the items are locked. This may prevent other transactions from executing.
If the controlling site fails, it cannot communicate with the other sites. These sites continue to keep the locked data items in their locked state, thus resulting in blocking.
Distributed Deadlock Avoidance
As in centralized system, distributed deadlock avoidance handles deadlock prior to occurrence. Additionally, in distributed systems, transaction location and transaction control issues needs to be addressed. Due to the distributed nature of the transaction, the following conflicts may occur −
- Conflict between two transactions in the same site.
- Conflict between two transactions in different sites.
In case of conflict, one of the transactions may be aborted or allowed to wait as per distributed wait-die or distributed wound-wait algorithms.
Let us assume that there are two transactions, T1 and T2. T1 arrives at Site P and tries to lock a data item which is already locked by T2 at that site. Hence, there is a conflict at Site P. The algorithms are as follows −
Distributed Wound-Die
If T1 is older than T2, T1 is allowed to wait. T1 can resume execution after Site P receives a message that T2 has either committed or aborted successfully at all sites.
If T1 is younger than T2, T1 is aborted. The concurrency control at Site P sends a message to all sites where T1 has visited to abort T1. The controlling site notifies the user when T1 has been successfully aborted in all the sites.
Distributed Wait-Wait
If T1 is older than T2, T2 needs to be aborted. If T2 is active at Site P, Site P aborts and rolls back T2 and then broadcasts this message to other relevant sites. If T2 has left Site P but is active at Site Q, Site P broadcasts that T2 has been aborted; Site L then aborts and rolls back T2 and sends this message to all sites.
If T1 is younger than T1, T1 is allowed to wait. T1 can resume execution after Site P receives a message that T2 has completed processing.
Distributed Deadlock Detection
Just like centralized deadlock detection approach, deadlocks are allowed to occur and are removed if detected. The system does not perform any checks when a transaction places a lock request. For implementation, global wait-for-graphs are created. Existence of a cycle in the global wait-for-graph indicates deadlocks. However, it is difficult to spot deadlocks since transaction waits for resources across the network.
Alternatively, deadlock detection algorithms can use timers. Each transaction is associated with a timer which is set to a time period in which a transaction is expected to finish. If a transaction does not finish within this time period, the timer goes off, indicating a possible deadlock.
Another tool used for deadlock handling is a deadlock detector. In a centralized system, there is one deadlock detector. In a distributed system, there can be more than one deadlock detectors. A deadlock detector can find deadlocks for the sites under its control. There are three alternatives for deadlock detection in a distributed system, namely.
Centralized Deadlock Detector − One site is designated as the central deadlock detector.
Hierarchical Deadlock Detector − A number of deadlock detectors are arranged in hierarchy.
Distributed Deadlock Detector − All the sites participate in detecting deadlocks and removing them.
This chapter looks into replication control, which is required to maintain consistent data in all sites. We will study the replication control techniques and the algorithms required for replication control.
As discussed earlier, replication is a technique used in distributed databases to store multiple copies of a data table at different sites. The problem with having multiple copies in multiple sites is the overhead of maintaining data consistency, particularly during update operations.
In order to maintain mutually consistent data in all sites, replication control techniques need to be adopted. There are two approaches for replication control, namely −
- Synchronous Replication Control
- Asynchronous Replication Control
Synchronous Replication Control
In synchronous replication approach, the database is synchronized so that all the replications always have the same value. A transaction requesting a data item will have access to the same value in all the sites. To ensure this uniformity, a transaction that updates a data item is expanded so that it makes the update in all the copies of the data item. Generally, two-phase commit protocol is used for the purpose.
For example, let us consider a data table PROJECT(PId, PName, PLocation). We need to run a transaction T1 that updates PLocation to ‘Mumbai’, if PLocation is ‘Bombay’. If no replications are there, the operations in transaction T1 will be −
Begin T1:
Update PROJECT Set PLocation = 'Mumbai'
Where PLocation = 'Bombay';
End T1;
If the data table has two replicas in Site A and Site B, T1 needs to spawn two children T1A and T1B corresponding to the two sites. The expanded transaction T1 will be −
Begin T1:
Begin T1A :
Update PROJECT Set PLocation = 'Mumbai'
Where PLocation = 'Bombay';
End T1A;
Begin T2A :
Update PROJECT Set PLocation = 'Mumbai'
Where PLocation = 'Bombay';
End T2A;
End T1;
Asynchronous Replication Control
In asynchronous replication approach, the replicas do not always maintain the same value. One or more replicas may store an outdated value, and a transaction can see the different values. The process of bringing all the replicas to the current value is called synchronization.
A popular method of synchronization is store and forward method. In this method, one site is designated as the primary site and the other sites are secondary sites. The primary site always contains updated values. All the transactions first enter the primary site. These transactions are then queued for application in the secondary sites. The secondary sites are updated using rollout method only when a transaction is scheduled to execute on it.
Replication Control Algorithms
Some of the replication control algorithms are −
- Master-slave replication control algorithm.
- Distributed voting algorithm.
- Majority consensus algorithm.
- Circulating token algorithm.
Master-Slave Replication Control Algorithm
There is one master site and ‘N’ slave sites. A master algorithm runs at the master site to detect conflicts. A copy of slave algorithm runs at each slave site. The overall algorithm executes in the following two phases −
Transaction acceptance/rejection phase − When a transaction enters the transaction monitor of a slave site, the slave site sends a request to the master site. The master site checks for conflicts. If there aren’t any conflicts, the master sends an “ACK+” message to the slave site which then starts the transaction application phase. Otherwise, the master sends an “ACK-” message to the slave which then rejects the transaction.
Transaction application phase − Upon entering this phase, the slave site where transaction has entered broadcasts a request to all slaves for executing the transaction. On receiving the requests, the peer slaves execute the transaction and send an “ACK” to the requesting slave on completion. After the requesting slave has received “ACK” messages from all its peers, it sends a “DONE” message to the master site. The master understands that the transaction has been completed and removes it from the pending queue.
Distributed Voting Algorithm
This comprises of ‘N’ peer sites, all of whom must “OK” a transaction before it starts executing. Following are the two phases of this algorithm −
Distributed transaction acceptance phase − When a transaction enters the transaction manager of a site, it sends a transaction request to all other sites. On receiving a request, a peer site resolves conflicts using priority based voting rules. If all the peer sites are “OK” with the transaction, the requesting site starts application phase. If any of the peer sites does not “OK” a transaction, the requesting site rejects the transaction.
Distributed transaction application phase − Upon entering this phase, the site where the transaction has entered, broadcasts a request to all slaves for executing the transaction. On receiving the requests, the peer slaves execute the transaction and send an “ACK” message to the requesting slave on completion. After the requesting slave has received “ACK” messages from all its peers, it lets the transaction manager know that the transaction has been completed.
Majority Consensus Algorithm
This is a variation from the distributed voting algorithm, where a transaction is allowed to execute when a majority of the peers “OK” a transaction. This is divided into three phases −
Voting phase − When a transaction enters the transaction manager of a site, it sends a transaction request to all other sites. On receiving a request, a peer site tests for conflicts using voting rules and keeps the conflicting transactions, if any, in pending queue. Then, it sends either an “OK” or a “NOT OK” message.
Transaction acceptance/rejection phase − If the requesting site receives a majority “OK” on the transaction, it accepts the transaction and broadcasts “ACCEPT” to all the sites. Otherwise, it broadcasts “REJECT” to all the sites and rejects the transaction.
Transaction application phase − When a peer site receives a “REJECT” message, it removes this transaction from its pending list and reconsiders all deferred transactions. When a peer site receives an “ACCEPT” message, it applies the transaction and rejects all the deferred transactions in the pending queue which are in conflict with this transaction. It sends an “ACK” to the requesting slave on completion.
Circulating Token Algorithm
In this approach the transactions in the system are serialized using a circulating token and executed accordingly against every replica of the database. Thus, all the transactions are accepted, i.e. none is rejected. This has two phases −
Transaction serialization phase − In this phase, all transactions are scheduled to run in a serialization order. Each transaction in each site is assigned a unique ticket from a sequential series, indicating the order of transaction. Once a transaction has been assigned a ticket, it is broadcasted to all the sites.
Transaction application phase − When a site receives a transaction along with its ticket, it places the transaction for execution according to its ticket. After the transaction has finished execution, this site broadcasts an appropriate message. A transaction ends when it has completed execution in all the sites.
A database management system is susceptible to a number of failures. In this chapter we will study the failure types and commit protocols. In a distributed database system, failures can be broadly categorized into soft failures, hard failures and network failures.
Soft Failure
Soft failure is the type of failure that causes the loss in volatile memory of the computer and not in the persistent storage. Here, the information stored in the non-persistent storage like main memory, buffers, caches or registers, is lost. They are also known as system crash. The various types of soft failures are as follows −
- Operating system failure.
- Main memory crash.
- Transaction failure or abortion.
- System generated error like integer overflow or divide-by-zero error.
- Failure of supporting software.
- Power failure.
Hard Failure
A hard failure is the type of failure that causes loss of data in the persistent or non-volatile storage like disk. Disk failure may cause corruption of data in some disk blocks or failure of the total disk. The causes of a hard failure are −
- Power failure.
- Faults in media.
- Read-write malfunction.
- Corruption of information on the disk.
- Read/write head crash of disk.
Recovery from disk failures can be short, if there is a new, formatted, and ready-to-use disk on reserve. Otherwise, duration includes the time it takes to get a purchase order, buy the disk, and prepare it.
Network Failure
Network failures are prevalent in distributed or network databases. These comprises of the errors induced in the database system due to the distributed nature of the data and transferring data over the network. The causes of network failure are as follows −
- Communication link failure.
- Network congestion.
- Information corruption during transfer.
- Site failures.
- Network partitioning.
Commit Protocols
Any database system should guarantee that the desirable properties of a transaction are maintained even after failures. If a failure occurs during the execution of a transaction, it may happen that all the changes brought about by the transaction are not committed. This makes the database inconsistent. Commit protocols prevent this scenario using either transaction undo (rollback) or transaction redo (roll forward).
Commit Point
The point of time at which the decision is made whether to commit or abort a transaction, is known as commit point. Following are the properties of a commit point.
It is a point of time when the database is consistent.
At this point, the modifications brought about by the database can be seen by the other transactions. All transactions can have a consistent view of the database.
At this point, all the operations of transaction have been successfully executed and their effects have been recorded in transaction log.
At this point, a transaction can be safely undone, if required.
At this point, a transaction releases all the locks held by it.
Transaction Undo
The process of undoing all the changes made to a database by a transaction is called transaction undo or transaction rollback. This is mostly applied in case of soft failure.
Transaction Redo
The process of reapplying the changes made to a database by a transaction is called transaction redo or transaction roll forward. This is mostly applied for recovery from a hard failure.
Transaction Log
A transaction log is a sequential file that keeps track of transaction operations on database items. As the log is sequential in nature, it is processed sequentially either from the beginning or from the end.
Purposes of a transaction log −
- To support commit protocols to commit or support transactions.
- To aid database recovery after failure.
A transaction log is usually kept on the disk, so that it is not affected by soft failures. Additionally, the log is periodically backed up to an archival storage like magnetic tape to protect it from disk failures as well.
Lists in Transaction Logs
The transaction log maintains five types of lists depending upon the status of the transaction. This list aids the recovery manager to ascertain the status of a transaction. The status and the corresponding lists are as follows −
A transaction that has a transaction start record and a transaction commit record, is a committed transaction – maintained in commit list.
A transaction that has a transaction start record and a transaction failed record but not a transaction abort record, is a failed transaction – maintained in failed list.
A transaction that has a transaction start record and a transaction abort record is an aborted transaction – maintained in abort list.
A transaction that has a transaction start record and a transaction before-commit record is a before-commit transaction, i.e. a transaction where all the operations have been executed but not committed – maintained in before-commit list.
A transaction that has a transaction start record but no records of before-commit, commit, abort or failed, is an active transaction – maintained in active list.
Immediate Update and Deferred Update
Immediate Update and Deferred Update are two methods for maintaining transaction logs.
In immediate update mode, when a transaction executes, the updates made by the transaction are written directly onto the disk. The old values and the updates values are written onto the log before writing to the database in disk. On commit, the changes made to the disk are made permanent. On rollback, changes made by the transaction in the database are discarded and the old values are restored into the database from the old values stored in the log.
In deferred update mode, when a transaction executes, the updates made to the database by the transaction are recorded in the log file. On commit, the changes in the log are written onto the disk. On rollback, the changes in the log are discarded and no changes are applied to the database.
In order to recuperate from database failure, database management systems resort to a number of recovery management techniques. In this chapter, we will study the different approaches for database recovery.
The typical strategies for database recovery are −
In case of soft failures that result in inconsistency of database, recovery strategy includes transaction undo or rollback. However, sometimes, transaction redo may also be adopted to recover to a consistent state of the transaction.
In case of hard failures resulting in extensive damage to database, recovery strategies encompass restoring a past copy of the database from archival backup. A more current state of the database is obtained through redoing operations of committed transactions from transaction log.
Recovery from Power Failure
Power failure causes loss of information in the non-persistent memory. When power is restored, the operating system and the database management system restart. Recovery manager initiates recovery from the transaction logs.
In case of immediate update mode, the recovery manager takes the following actions −
Transactions which are in active list and failed list are undone and written on the abort list.
Transactions which are in before-commit list are redone.
No action is taken for transactions in commit or abort lists.
In case of deferred update mode, the recovery manager takes the following actions −
Transactions which are in the active list and failed list are written onto the abort list. No undo operations are required since the changes have not been written to the disk yet.
Transactions which are in before-commit list are redone.
No action is taken for transactions in commit or abort lists.
Recovery from Disk Failure
A disk failure or hard crash causes a total database loss. To recover from this hard crash, a new disk is prepared, then the operating system is restored, and finally the database is recovered using the database backup and transaction log. The recovery method is same for both immediate and deferred update modes.
The recovery manager takes the following actions −
The transactions in the commit list and before-commit list are redone and written onto the commit list in the transaction log.
The transactions in the active list and failed list are undone and written onto the abort list in the transaction log.
Checkpointing
Checkpoint is a point of time at which a record is written onto the database from the buffers. As a consequence, in case of a system crash, the recovery manager does not have to redo the transactions that have been committed before checkpoint. Periodical checkpointing shortens the recovery process.
The two types of checkpointing techniques are −
- Consistent checkpointing
- Fuzzy checkpointing
Consistent Checkpointing
Consistent checkpointing creates a consistent image of the database at checkpoint. During recovery, only those transactions which are on the right side of the last checkpoint are undone or redone. The transactions to the left side of the last consistent checkpoint are already committed and needn’t be processed again. The actions taken for checkpointing are −
- The active transactions are suspended temporarily.
- All changes in main-memory buffers are written onto the disk.
- A “checkpoint” record is written in the transaction log.
- The transaction log is written to the disk.
- The suspended transactions are resumed.
If in step 4, the transaction log is archived as well, then this checkpointing aids in recovery from disk failures and power failures, otherwise it aids recovery from only power failures.
Fuzzy Checkpointing
In fuzzy checkpointing, at the time of checkpoint, all the active transactions are written in the log. In case of power failure, the recovery manager processes only those transactions that were active during checkpoint and later. The transactions that have been committed before checkpoint are written to the disk and hence need not be redone.
Example of Checkpointing
Let us consider that in system the time of checkpointing is tcheck and the time of system crash is tfail. Let there be four transactions Ta, Tb, Tc and Td such that −
Ta commits before checkpoint.
Tb starts before checkpoint and commits before system crash.
Tc starts after checkpoint and commits before system crash.
Td starts after checkpoint and was active at the time of system crash.
The situation is depicted in the following diagram −
The actions that are taken by the recovery manager are −
- Nothing is done with Ta.
- Transaction redo is performed for Tb and Tc.
- Transaction undo is performed for Td.
Transaction Recovery Using UNDO / REDO
Transaction recovery is done to eliminate the adverse effects of faulty transactions rather than to recover from a failure. Faulty transactions include all transactions that have changed the database into undesired state and the transactions that have used values written by the faulty transactions.
Transaction recovery in these cases is a two-step process −
UNDO all faulty transactions and transactions that may be affected by the faulty transactions.
REDO all transactions that are not faulty but have been undone due to the faulty transactions.
Steps for the UNDO operation are −
If the faulty transaction has done INSERT, the recovery manager deletes the data item(s) inserted.
If the faulty transaction has done DELETE, the recovery manager inserts the deleted data item(s) from the log.
If the faulty transaction has done UPDATE, the recovery manager eliminates the value by writing the before-update value from the log.
Steps for the REDO operation are −
If the transaction has done INSERT, the recovery manager generates an insert from the log.
If the transaction has done DELETE, the recovery manager generates a delete from the log.
If the transaction has done UPDATE, the recovery manager generates an update from the log.
In a local database system, for committing a transaction, the transaction manager has to only convey the decision to commit to the recovery manager. However, in a distributed system, the transaction manager should convey the decision to commit to all the servers in the various sites where the transaction is being executed and uniformly enforce the decision. When processing is complete at each site, it reaches the partially committed transaction state and waits for all other transactions to reach their partially committed states. When it receives the message that all the sites are ready to commit, it starts to commit. In a distributed system, either all sites commit or none of them does.
The different distributed commit protocols are −
- One-phase commit
- Two-phase commit
- Three-phase commit
Distributed One-phase Commit
Distributed one-phase commit is the simplest commit protocol. Let us consider that there is a controlling site and a number of slave sites where the transaction is being executed. The steps in distributed commit are −
After each slave has locally completed its transaction, it sends a “DONE” message to the controlling site.
The slaves wait for “Commit” or “Abort” message from the controlling site. This waiting time is called window of vulnerability.
When the controlling site receives “DONE” message from each slave, it makes a decision to commit or abort. This is called the commit point. Then, it sends this message to all the slaves.
On receiving this message, a slave either commits or aborts and then sends an acknowledgement message to the controlling site.
Distributed Two-phase Commit
Distributed two-phase commit reduces the vulnerability of one-phase commit protocols. The steps performed in the two phases are as follows −
Phase 1: Prepare Phase
After each slave has locally completed its transaction, it sends a “DONE” message to the controlling site. When the controlling site has received “DONE” message from all slaves, it sends a “Prepare” message to the slaves.
The slaves vote on whether they still want to commit or not. If a slave wants to commit, it sends a “Ready” message.
A slave that does not want to commit sends a “Not Ready” message. This may happen when the slave has conflicting concurrent transactions or there is a timeout.
Phase 2: Commit/Abort Phase
After the controlling site has received “Ready” message from all the slaves −
The controlling site sends a “Global Commit” message to the slaves.
The slaves apply the transaction and send a “Commit ACK” message to the controlling site.
When the controlling site receives “Commit ACK” message from all the slaves, it considers the transaction as committed.
After the controlling site has received the first “Not Ready” message from any slave −
The controlling site sends a “Global Abort” message to the slaves.
The slaves abort the transaction and send a “Abort ACK” message to the controlling site.
When the controlling site receives “Abort ACK” message from all the slaves, it considers the transaction as aborted.
Distributed Three-phase Commit
The steps in distributed three-phase commit are as follows −
Phase 1: Prepare Phase
The steps are same as in distributed two-phase commit.
Phase 2: Prepare to Commit Phase
- The controlling site issues an “Enter Prepared State” broadcast message.
- The slave sites vote “OK” in response.
Phase 3: Commit / Abort Phase
The steps are same as two-phase commit except that “Commit ACK”/”Abort ACK” message is not required.
In this chapter, we will look into the threats that a database system faces and the measures of control. We will also study cryptography as a security tool.
Database Security and Threats
Data security is an imperative aspect of any database system. It is of particular importance in distributed systems because of large number of users, fragmented and replicated data, multiple sites and distributed control.
Threats in a Database
Availability loss − Availability loss refers to non-availability of database objects by legitimate users.
Integrity loss − Integrity loss occurs when unacceptable operations are performed upon the database either accidentally or maliciously. This may happen while creating, inserting, updating or deleting data. It results in corrupted data leading to incorrect decisions.
Confidentiality loss − Confidentiality loss occurs due to unauthorized or unintentional disclosure of confidential information. It may result in illegal actions, security threats and loss in public confidence.
Measures of Control
The measures of control can be broadly divided into the following categories −
Access Control − Access control includes security mechanisms in a database management system to protect against unauthorized access. A user can gain access to the database after clearing the login process through only valid user accounts. Each user account is password protected.
Flow Control − Distributed systems encompass a lot of data flow from one site to another and also within a site. Flow control prevents data from being transferred in such a way that it can be accessed by unauthorized agents. A flow policy lists out the channels through which information can flow. It also defines security classes for data as well as transactions.
Data Encryption − Data encryption refers to coding data when sensitive data is to be communicated over public channels. Even if an unauthorized agent gains access of the data, he cannot understand it since it is in an incomprehensible format.
What is Cryptography?
Cryptography is the science of encoding information before sending via unreliable communication paths so that only an authorized receiver can decode and use it.
The coded message is called cipher text and the original message is called plain text. The process of converting plain text to cipher text by the sender is called encoding or encryption. The process of converting cipher text to plain text by the receiver is called decoding or decryption.
The entire procedure of communicating using cryptography can be illustrated through the following diagram −
Conventional Encryption Methods
In conventional cryptography, the encryption and decryption is done using the same secret key. Here, the sender encrypts the message with an encryption algorithm using a copy of the secret key. The encrypted message is then send over public communication channels. On receiving the encrypted message, the receiver decrypts it with a corresponding decryption algorithm using the same secret key.
Security in conventional cryptography depends on two factors −
A sound algorithm which is known to all.
A randomly generated, preferably long secret key known only by the sender and the receiver.
The most famous conventional cryptography algorithm is Data Encryption Standard or DES.
The advantage of this method is its easy applicability. However, the greatest problem of conventional cryptography is sharing the secret key between the communicating parties. The ways to send the key are cumbersome and highly susceptible to eavesdropping.
Public Key Cryptography
In contrast to conventional cryptography, public key cryptography uses two different keys, referred to as public key and the private key. Each user generates the pair of public key and private key. The user then puts the public key in an accessible place. When a sender wants to sends a message, he encrypts it using the public key of the receiver. On receiving the encrypted message, the receiver decrypts it using his private key. Since the private key is not known to anyone but the receiver, no other person who receives the message can decrypt it.
The most popular public key cryptography algorithms are RSA algorithm and Diffie– Hellman algorithm. This method is very secure to send private messages. However, the problem is, it involves a lot of computations and so proves to be inefficient for long messages.
The solution is to use a combination of conventional and public key cryptography. The secret key is encrypted using public key cryptography before sharing between the communicating parties. Then, the message is send using conventional cryptography with the aid of the shared secret key.
Digital Signatures
A Digital Signature (DS) is an authentication technique based on public key cryptography used in e-commerce applications. It associates a unique mark to an individual within the body of his message. This helps others to authenticate valid senders of messages.
Typically, a user’s digital signature varies from message to message in order to provide security against counterfeiting. The method is as follows −
The sender takes a message, calculates the message digest of the message and signs it digest with a private key.
The sender then appends the signed digest along with the plaintext message.
The message is sent over communication channel.
The receiver removes the appended signed digest and verifies the digest using the corresponding public key.
The receiver then takes the plaintext message and runs it through the same message digest algorithm.
If the results of step 4 and step 5 match, then the receiver knows that the message has integrity and authentic.
A distributed system needs additional security measures than centralized system, since there are many users, diversified data, multiple sites and distributed control. In this chapter, we will look into the various facets of distributed database security.
In distributed communication systems, there are two types of intruders −
Passive eavesdroppers − They monitor the messages and get hold of private information.
Active attackers − They not only monitor the messages but also corrupt data by inserting new data or modifying existing data.
Security measures encompass security in communications, security in data and data auditing.
Communications Security
In a distributed database, a lot of data communication takes place owing to the diversified location of data, users and transactions. So, it demands secure communication between users and databases and between the different database environments.
Security in communication encompasses the following −
Data should not be corrupt during transfer.
The communication channel should be protected against both passive eavesdroppers and active attackers.
In order to achieve the above stated requirements, well-defined security algorithms and protocols should be adopted.
Two popular, consistent technologies for achieving end-to-end secure communications are −
- Secure Socket Layer Protocol or Transport Layer Security Protocol.
- Virtual Private Networks (VPN).
Data Security
In distributed systems, it is imperative to adopt measure to secure data apart from communications. The data security measures are −
Authentication and authorization − These are the access control measures adopted to ensure that only authentic users can use the database. To provide authentication digital certificates are used. Besides, login is restricted through username/password combination.
Data encryption − The two approaches for data encryption in distributed systems are −
Internal to distributed database approach: The user applications encrypt the data and then store the encrypted data in the database. For using the stored data, the applications fetch the encrypted data from the database and then decrypt it.
External to distributed database: The distributed database system has its own encryption capabilities. The user applications store data and retrieve them without realizing that the data is stored in an encrypted form in the database.
Validated input − In this security measure, the user application checks for each input before it can be used for updating the database. An un-validated input can cause a wide range of exploits like buffer overrun, command injection, cross-site scripting and corruption in data.
Data Auditing
A database security system needs to detect and monitor security violations, in order to ascertain the security measures it should adopt. It is often very difficult to detect breach of security at the time of occurrences. One method to identify security violations is to examine audit logs. Audit logs contain information such as −
- Date, time and site of failed access attempts.
- Details of successful access attempts.
- Vital modifications in the database system.
- Access of huge amounts of data, particularly from databases in multiple sites.
All the above information gives an insight of the activities in the database. A periodical analysis of the log helps to identify any unnatural activity along with its site and time of occurrence. This log is ideally stored in a separate server so that it is inaccessible to attackers.