SGBD - Système de stockage

Les bases de données sont stockées dans des formats de fichiers contenant des enregistrements. Au niveau physique, les données réelles sont stockées au format électromagnétique sur certains appareils. Ces périphériques de stockage peuvent être classés en trois types -

  • Primary Storage- Le stockage mémoire directement accessible à la CPU entre dans cette catégorie. La mémoire interne (registres), la mémoire rapide (cache) et la mémoire principale (RAM) du processeur sont directement accessibles au processeur, car elles sont toutes placées sur la carte mère ou le chipset du processeur. Ce stockage est généralement très petit, ultra-rapide et volatil. Le stockage principal nécessite une alimentation électrique continue pour conserver son état. En cas de panne de courant, toutes ses données sont perdues.

  • Secondary Storage- Les périphériques de stockage secondaires sont utilisés pour stocker des données pour une utilisation future ou comme sauvegarde. Le stockage secondaire comprend les périphériques de mémoire qui ne font pas partie du chipset du processeur ou de la carte mère, par exemple, les disques magnétiques, les disques optiques (DVD, CD, etc.), les disques durs, les lecteurs flash et les bandes magnétiques.

  • Tertiary Storage- Le stockage tertiaire est utilisé pour stocker d'énormes volumes de données. Étant donné que ces périphériques de stockage sont externes au système informatique, ils sont les plus lents en vitesse. Ces périphériques de stockage sont principalement utilisés pour prendre en charge un système entier. Les disques optiques et les bandes magnétiques sont largement utilisés comme stockage tertiaire.

Hiérarchie de la mémoire

Un système informatique a une hiérarchie de mémoire bien définie. Un processeur a un accès direct à sa mémoire principale ainsi qu'à ses registres intégrés. Le temps d'accès de la mémoire principale est évidemment inférieur à la vitesse du processeur. Pour minimiser cette discordance de vitesse, la mémoire cache est introduite. La mémoire cache fournit le temps d'accès le plus rapide et contient les données les plus fréquemment utilisées par le processeur.

La mémoire avec l'accès le plus rapide est la plus coûteuse. Les périphériques de stockage plus grands offrent une vitesse lente et sont moins chers, mais ils peuvent stocker d'énormes volumes de données par rapport aux registres du processeur ou à la mémoire cache.

Disques magnétiques

Les disques durs sont les périphériques de stockage secondaires les plus courants dans les systèmes informatiques actuels. Ceux-ci sont appelés disques magnétiques car ils utilisent le concept de magnétisation pour stocker des informations. Les disques durs sont constitués de disques métalliques revêtus d'un matériau magnétisable. Ces disques sont placés verticalement sur une broche. Une tête de lecture / écriture se déplace entre les disques et est utilisée pour magnétiser ou démagnétiser la tache en dessous. Un spot magnétisé peut être reconnu comme 0 (zéro) ou 1 (un).

Les disques durs sont formatés dans un ordre bien défini pour stocker efficacement les données. Une plaque de disque dur comporte de nombreux cercles concentriques, appeléstracks. Chaque piste est divisée ensectors. Un secteur sur un disque dur stocke généralement 512 octets de données.

Réseau redondant de disques indépendants

RAID ou Rédondant Array de Indépendant Disks, est une technologie permettant de connecter plusieurs périphériques de stockage secondaires et de les utiliser comme un seul support de stockage.

Le RAID consiste en un ensemble de disques dans lesquels plusieurs disques sont connectés ensemble pour atteindre différents objectifs. Les niveaux RAID définissent l'utilisation des matrices de disques.

RAID 0

Dans ce niveau, une matrice de disques par bandes est implémentée. Les données sont décomposées en blocs et les blocs sont répartis entre les disques. Chaque disque reçoit un bloc de données à écrire / lire en parallèle. Il améliore la vitesse et les performances du périphérique de stockage. Il n'y a pas de parité et de sauvegarde au niveau 0.

RAID 1

RAID 1 utilise des techniques de mise en miroir. Lorsque les données sont envoyées à un contrôleur RAID, il envoie une copie des données à tous les disques de la matrice. Le niveau RAID 1 est également appelémirroring et offre une redondance à 100% en cas de panne.

RAID 2

RAID 2 enregistre le code de correction d'erreur en utilisant la distance de Hamming pour ses données, réparties sur différents disques. Comme au niveau 0, chaque bit de données dans un mot est enregistré sur un disque séparé et les codes ECC des mots de données sont stockés sur un ensemble de disques différents. En raison de sa structure complexe et de son coût élevé, RAID 2 n'est pas disponible dans le commerce.

RAID 3

RAID 3 répartit les données sur plusieurs disques. Le bit de parité généré pour le mot de données est stocké sur un disque différent. Cette technique permet de surmonter les pannes de disque unique.

RAID 4

Dans ce niveau, un bloc entier de données est écrit sur des disques de données, puis la parité est générée et stockée sur un disque différent. Notez que le niveau 3 utilise la répartition au niveau des octets, tandis que le niveau 4 utilise la répartition au niveau du bloc. Les niveaux 3 et 4 nécessitent au moins trois disques pour implémenter le RAID.

RAID 5

RAID 5 écrit des blocs de données entiers sur différents disques, mais les bits de parité générés pour la bande de blocs de données sont répartis entre tous les disques de données plutôt que de les stocker sur un disque dédié différent.

RAID 6

RAID 6 est une extension du niveau 5. Dans ce niveau, deux parités indépendantes sont générées et stockées de manière distribuée entre plusieurs disques. Deux parités offrent une tolérance de panne supplémentaire. Ce niveau nécessite au moins quatre unités de disque pour implémenter RAID.