Entreposage de données - Sauvegarde

Un entrepôt de données est un système complexe et il contient un énorme volume de données. Par conséquent, il est important de sauvegarder toutes les données afin qu'elles deviennent disponibles pour une récupération à l'avenir selon les besoins. Dans ce chapitre, nous aborderons les problèmes liés à la conception de la stratégie de sauvegarde.

Terminologies de sauvegarde

Avant de continuer, vous devez connaître certaines des terminologies de sauvegarde décrites ci-dessous.

  • Complete backup- Il sauvegarde la base de données entière en même temps. Cette sauvegarde comprend tous les fichiers de base de données, les fichiers de contrôle et les fichiers journaux.

  • Partial backup- Comme son nom l'indique, il ne crée pas une sauvegarde complète de la base de données. La sauvegarde partielle est très utile dans les grandes bases de données car elle permet une stratégie dans laquelle diverses parties de la base de données sont sauvegardées quotidiennement de manière circulaire, de sorte que toute la base de données soit sauvegardée efficacement une fois par semaine.

  • Cold backup- Une sauvegarde à froid est effectuée lorsque la base de données est complètement arrêtée. Dans un environnement multi-instance, toutes les instances doivent être arrêtées.

  • Hot backup- La sauvegarde à chaud est effectuée lorsque le moteur de base de données est opérationnel. Les exigences de la sauvegarde à chaud varient du SGBDR au SGBDR.

  • Online backup - C'est assez similaire à la sauvegarde à chaud.

Sauvegarde matérielle

Il est important de décider quel matériel utiliser pour la sauvegarde. La vitesse de traitement de la sauvegarde et de la restauration dépend du matériel utilisé, de la manière dont le matériel est connecté, de la bande passante du réseau, du logiciel de sauvegarde et de la vitesse du système d'E / S du serveur. Nous discuterons ici de certains des choix matériels disponibles et de leurs avantages et inconvénients. Ces choix sont les suivants -

  • Technologie de bande
  • Sauvegardes sur disque

Technologie de bande

Le choix de la bande peut être classé comme suit -

  • Médias de bande
  • Lecteurs de bande autonomes
  • Empileurs de bandes
  • Silos à ruban

Tape Media

Il existe plusieurs variétés de supports de bande. Certaines normes de support de bande sont répertoriées dans le tableau ci-dessous -

Médias de bande Capacité Taux d'E / S
DLT 40 Go 3 Mo / s
3490e 1,6 Go 3 Mo / s
8 mm 14 Go 1 Mo / s

Les autres facteurs à prendre en compte sont les suivants:

  • Fiabilité du support de bande
  • Coût du support de bande par unité
  • Scalability
  • Coût des mises à niveau du système de bandes
  • Coût du support de bande par unité
  • Durée de conservation du support de bande

Standalone Tape Drives

Les lecteurs de bande peuvent être connectés des manières suivantes:

  • Directement au serveur
  • En tant que périphériques disponibles sur le réseau
  • À distance vers une autre machine

Des problèmes peuvent survenir lors de la connexion des lecteurs de bande à un entrepôt de données.

  • Considérez que le serveur est une machine MPP à 48 nœuds. Nous ne connaissons pas le nœud pour connecter le lecteur de bande et nous ne savons pas comment les répartir sur les nœuds du serveur pour obtenir des performances optimales avec le moins de perturbations du serveur et la moindre latence d'E / S internes.

  • La connexion du lecteur de bande en tant que périphérique disponible sur le réseau nécessite que le réseau soit à la hauteur des énormes taux de transfert de données. Assurez-vous qu'une bande passante suffisante est disponible pendant le temps que vous en avez besoin.

  • La connexion à distance des lecteurs de bande nécessite également une bande passante élevée.

Empileurs de bandes

La méthode de chargement de plusieurs bandes dans un seul lecteur de bande est connue sous le nom d'empileurs de bandes. L'empileur démonte la bande actuelle quand il en a terminé et charge la bande suivante. Par conséquent, une seule bande est disponible à la fois pour y accéder. Le prix et les capacités peuvent varier, mais la capacité commune est qu'ils peuvent effectuer des sauvegardes sans surveillance.

Silos à bande

Les silos à bande offrent de grandes capacités de stockage. Les silos à bandes peuvent stocker et gérer des milliers de bandes. Ils peuvent intégrer plusieurs lecteurs de bande. Ils ont le logiciel et le matériel nécessaires pour étiqueter et stocker les bandes qu'ils stockent. Il est très courant que le silo soit connecté à distance via un réseau ou une liaison dédiée. Nous devons nous assurer que la bande passante de la connexion est à la hauteur du travail.

Sauvegardes sur disque

Les méthodes de sauvegarde de disque sont -

  • Sauvegardes disque à disque
  • Miroir cassant

Ces méthodes sont utilisées dans le système OLTP. Ces méthodes minimisent les temps d'arrêt de la base de données et maximisent la disponibilité.

Disk-to-Disk Backups

Ici, la sauvegarde est effectuée sur le disque plutôt que sur la bande. Les sauvegardes de disque à disque sont effectuées pour les raisons suivantes -

  • Vitesse des sauvegardes initiales
  • Vitesse de restauration

La sauvegarde des données du disque vers le disque est beaucoup plus rapide que sur la bande. Cependant c'est l'étape intermédiaire de sauvegarde. Plus tard, les données sont sauvegardées sur la bande. L'autre avantage des sauvegardes disque à disque est qu'elle vous donne une copie en ligne de la dernière sauvegarde.

Mirror Breaking

L'idée est d'avoir des disques en miroir pour la résilience pendant la journée de travail. Lorsqu'une sauvegarde est requise, l'un des ensembles de miroirs peut être brisé. Cette technique est une variante des sauvegardes de disque à disque.

Note - La base de données peut devoir être arrêtée pour garantir la cohérence de la sauvegarde.

Jukeboxes optiques

Les juke-box optiques permettent de stocker les données près de la ligne. Cette technique permet de gérer un grand nombre de disques optiques de la même manière qu'un empileur de bandes ou un silo à bandes. L'inconvénient de cette technique est qu'elle a une vitesse d'écriture lente par rapport aux disques. Mais le support optique offre une longue durée de vie et une fiabilité qui en font un bon choix de support d'archivage.

Sauvegardes de logiciels

Il existe des outils logiciels disponibles qui aident dans le processus de sauvegarde. Ces outils logiciels sont fournis sous forme de package. Ces outils ne prennent pas seulement des sauvegardes, ils peuvent gérer et contrôler efficacement les stratégies de sauvegarde. Il existe de nombreux logiciels disponibles sur le marché. Certains d'entre eux sont répertoriés dans le tableau suivant -

Nom du paquet Vendeur
Networker Legato
ADSM IBM
Époque Systèmes d'époque
Omniback II HP
Alexandrie Sequent

Critères de choix des packages logiciels

Les critères de choix du meilleur progiciel sont énumérés ci-dessous -

  • Dans quelle mesure le produit est-il évolutif à mesure que des lecteurs de bande sont ajoutés?
  • Le package a-t-il une option client-serveur ou doit-il s'exécuter sur le serveur de base de données lui-même?
  • Fonctionnera-t-il dans les environnements de cluster et MPP?
  • Quel degré de parallélisme est requis?
  • Quelles plates-formes sont prises en charge par le package?
  • Le package prend-il en charge un accès facile aux informations sur le contenu de la bande?
  • La base de données des packages est-elle consciente?
  • Quel lecteur de bande et quel support de bande sont pris en charge par le package?