Zookeeper - Guide rapide

ZooKeeper est un service de coordination distribué pour gérer un grand nombre d'hôtes. La coordination et la gestion d'un service dans un environnement distribué est un processus compliqué. ZooKeeper résout ce problème avec son architecture et son API simples. ZooKeeper permet aux développeurs de se concentrer sur la logique principale de l'application sans se soucier de la nature distribuée de l'application.

Le framework ZooKeeper a été conçu à l'origine chez "Yahoo!" pour accéder à leurs applications de manière simple et robuste. Plus tard, Apache ZooKeeper est devenu un standard pour le service organisé utilisé par Hadoop, HBase et d'autres frameworks distribués. Par exemple, Apache HBase utilise ZooKeeper pour suivre l'état des données distribuées.

Avant d'aller plus loin, il est important que nous sachions une chose ou deux sur les applications distribuées. Alors, commençons la discussion par un bref aperçu des applications distribuées.

Application distribuée

Une application distribuée peut s'exécuter sur plusieurs systèmes d'un réseau à un moment donné (simultanément) en se coordonnant entre eux pour accomplir une tâche particulière de manière rapide et efficace. Normalement, des tâches complexes et chronophages, qui prendront des heures à être accomplies par une application non distribuée (exécutée dans un seul système), peuvent être effectuées en quelques minutes par une application distribuée en utilisant les capacités de calcul de tout le système impliqué.

Le temps nécessaire pour terminer la tâche peut être encore réduit en configurant l'application distribuée pour qu'elle s'exécute sur plus de systèmes. Un groupe de systèmes dans lequel une application distribuée s'exécute est appelé unCluster et chaque machine fonctionnant dans un cluster est appelée un Node.

Une application distribuée comprend deux parties, Server et Clientapplication. Les applications serveur sont en fait distribuées et ont une interface commune afin que les clients puissent se connecter à n'importe quel serveur du cluster et obtenir le même résultat. Les applications clientes sont les outils permettant d'interagir avec une application distribuée.

Avantages des applications distribuées

  • Reliability - La défaillance d'un ou de quelques systèmes ne fait pas échouer l'ensemble du système.

  • Scalability - Les performances peuvent être augmentées au fur et à mesure des besoins en ajoutant plus de machines avec des changements mineurs dans la configuration de l'application sans temps d'arrêt.

  • Transparency - Cache la complexité du système et se présente comme une seule entité / application.

Défis des applications distribuées

  • Race condition- Deux machines ou plus essayant d'exécuter une tâche particulière, qui ne doit en fait être effectuée que par une seule machine à un moment donné. Par exemple, les ressources partagées ne doivent être modifiées que par une seule machine à un moment donné.

  • Deadlock - Deux opérations ou plus en attente l'une de l'autre pour se terminer indéfiniment.

  • Inconsistency - Panne partielle des données.

À quoi sert Apache ZooKeeper?

Apache ZooKeeper est un service utilisé par un cluster (groupe de nœuds) pour se coordonner entre eux et maintenir des données partagées avec des techniques de synchronisation robustes. ZooKeeper est elle-même une application distribuée fournissant des services d'écriture d'une application distribuée.

Les services communs fournis par ZooKeeper sont les suivants -

  • Naming service- Identifier les nœuds d'un cluster par leur nom. C'est similaire au DNS, mais pour les nœuds.

  • Configuration management - Informations de configuration les plus récentes et à jour du système pour un nœud de jonction.

  • Cluster management - Rejoindre / quitter un nœud dans un cluster et l'état du nœud en temps réel.

  • Leader election - Élire un nœud comme chef de file à des fins de coordination.

  • Locking and synchronization service- Verrouillage des données lors de leur modification. Ce mécanisme vous aide dans la récupération automatique en cas d'échec tout en connectant d'autres applications distribuées comme Apache HBase.

  • Highly reliable data registry - Disponibilité des données même lorsqu'un ou quelques nœuds sont en panne.

Les applications distribuées offrent de nombreux avantages, mais elles posent également quelques défis complexes et difficiles à résoudre. Le framework ZooKeeper fournit un mécanisme complet pour surmonter tous les défis. La condition de course et l'impasse sont gérées en utilisantfail-safe synchronization approach. Un autre inconvénient majeur est l'incohérence des données, que ZooKeeper résout avecatomicity.

Avantages de ZooKeeper

Voici les avantages de l'utilisation de ZooKeeper -

  • Simple distributed coordination process

  • Synchronization- Exclusion mutuelle et coopération entre les processus serveur. Ce processus aide dans Apache HBase pour la gestion de la configuration.

  • Ordered Messages

  • Serialization- Encodez les données selon des règles spécifiques. Assurez-vous que votre application fonctionne de manière cohérente. Cette approche peut être utilisée dans MapReduce pour coordonner la file d'attente afin d'exécuter les threads en cours d'exécution.

  • Reliability

  • Atomicity - Le transfert de données réussit ou échoue complètement, mais aucune transaction n'est partielle.

Avant d'approfondir le fonctionnement de ZooKeeper, jetons un coup d'œil aux concepts fondamentaux de ZooKeeper. Nous aborderons les sujets suivants dans ce chapitre -

  • Architecture
  • Espace de noms hiérarchique
  • Session
  • Watches

Architecture de ZooKeeper

Jetez un œil au diagramme suivant. Il décrit «l'architecture client-serveur» de ZooKeeper.

Chacun des composants faisant partie de l'architecture ZooKeeper a été expliqué dans le tableau suivant.

Partie La description
Client

Les clients, l'un des nœuds de notre cluster d'applications distribuées, accèdent aux informations du serveur. Pour un intervalle de temps particulier, chaque client envoie un message au serveur pour informer le serveur que le client est actif.

De même, le serveur envoie un accusé de réception lorsqu'un client se connecte. S'il n'y a pas de réponse du serveur connecté, le client redirige automatiquement le message vers un autre serveur.

Serveur Server, l'un des nœuds de notre ensemble ZooKeeper, fournit tous les services aux clients. Donne un accusé de réception au client pour l'informer que le serveur est actif.
Ensemble Groupe de serveurs ZooKeeper. Le nombre minimum de nœuds requis pour former un ensemble est de 3.
Chef Nœud de serveur qui effectue une récupération automatique en cas de défaillance de l'un des nœuds connectés. Les dirigeants sont élus au démarrage du service.
Disciple Nœud de serveur qui suit les instructions du leader.

Espace de noms hiérarchique

Le diagramme suivant illustre l'arborescence du système de fichiers ZooKeeper utilisé pour la représentation de la mémoire. Le nœud ZooKeeper est appeléznode. Chaque znode est identifié par un nom et séparé par une séquence de chemin (/).

  • Dans le diagramme, vous avez d'abord une racine znodeséparé par "/". Sous root, vous avez deux espaces de noms logiquesconfig et workers.

  • le config l'espace de noms est utilisé pour la gestion centralisée de la configuration et workers l'espace de noms est utilisé pour la dénomination.

  • En dessous de confignamespace, chaque znode peut stocker jusqu'à 1 Mo de données. Ceci est similaire au système de fichiers UNIX sauf que le znode parent peut également stocker des données. L'objectif principal de cette structure est de stocker des données synchronisées et de décrire les métadonnées du znode. Cette structure est appelée commeZooKeeper Data Model.

Chaque znode du modèle de données ZooKeeper maintient un statstructure. Une statistique fournit simplement lemetadatad'un znode. Il se compose du numéro de version, de la liste de contrôle des actions (ACL), de l'horodatage et de la longueur des données.

  • Version number- Chaque znode a un numéro de version, ce qui signifie que chaque fois que les données associées au znode changent, son numéro de version correspondant augmente également. L'utilisation du numéro de version est importante lorsque plusieurs clients zookeeper tentent d'effectuer des opérations sur le même znode.

  • Action Control List (ACL)- ACL est essentiellement un mécanisme d'authentification pour accéder au znode. Il régit toutes les opérations de lecture et d'écriture de znode.

  • Timestamp- L'horodatage représente le temps écoulé depuis la création et la modification de znode. Il est généralement représenté en millisecondes. ZooKeeper identifie chaque modification apportée aux znodes à partir de «Transaction ID» (zxid).Zxid est unique et maintient le temps pour chaque transaction afin que vous puissiez facilement identifier le temps écoulé d'une demande à une autre demande.

  • Data length- La quantité totale de données stockées dans un znode correspond à la longueur des données. Vous pouvez stocker un maximum de 1 Mo de données.

Types de Znodes

Les znodes sont classés en persistance, séquentiel et éphémère.

  • Persistence znode- Le znode de persistance est actif même après que le client, qui a créé ce znode particulier, est déconnecté. Par défaut, tous les znodes sont persistants, sauf indication contraire.

  • Ephemeral znode- Les znodes éphémères sont actifs jusqu'à ce que le client soit vivant. Lorsqu'un client est déconnecté de l'ensemble ZooKeeper, les znodes éphémères sont supprimés automatiquement. Pour cette raison, seuls les znodes éphémères ne sont pas autorisés à avoir d'autres enfants. Si un znode éphémère est supprimé, le nœud approprié suivant remplira sa position. Les znodes éphémères jouent un rôle important dans l'élection du leader.

  • Sequential znode- Les znodes séquentiels peuvent être persistants ou éphémères. Lorsqu'un nouveau znode est créé en tant que znode séquentiel, ZooKeeper définit le chemin du znode en attachant un numéro de séquence à 10 chiffres au nom d'origine. Par exemple, si un znode avec chemin/myapp est créé comme un znode séquentiel, ZooKeeper changera le chemin en /myapp0000000001et définissez le numéro de séquence suivant sur 0000000002. Si deux znodes séquentiels sont créés simultanément, ZooKeeper n'utilise jamais le même numéro pour chaque znode. Les znodes séquentiels jouent un rôle important dans le verrouillage et la synchronisation.

Séances

Les sessions sont très importantes pour le fonctionnement de ZooKeeper. Les demandes dans une session sont exécutées dans l'ordre FIFO. Une fois qu'un client se connecte à un serveur, la session est établie et unsession id est attribué au client.

Le client envoie heartbeatsà un intervalle de temps particulier pour garder la session valide. Si l'ensemble ZooKeeper ne reçoit pas de pulsations d'un client pendant plus de la période (délai d'expiration de session) spécifiée au démarrage du service, il décide que le client est décédé.

Les délais d'expiration de session sont généralement représentés en millisecondes. Lorsqu'une session se termine pour une raison quelconque, les znodes éphémères créés au cours de cette session sont également supprimés.

Montres

Les montres sont un mécanisme simple permettant au client de recevoir des notifications sur les modifications apportées à l'ensemble ZooKeeper. Les clients peuvent régler des montres tout en lisant un znode particulier. Les montres envoient une notification au client enregistré pour tout changement de znode (sur lequel le client s'enregistre).

Les changements Znode sont des modifications des données associées au znode ou des changements dans les enfants du znode. Les montres ne sont déclenchées qu'une seule fois. Si un client souhaite à nouveau une notification, elle doit être effectuée via une autre opération de lecture. Lorsqu'une session de connexion est expirée, le client sera déconnecté du serveur et les montres associées sont également supprimées.

Une fois qu'un ensemble ZooKeeper démarre, il attend la connexion des clients. Les clients se connecteront à l'un des nœuds de l'ensemble ZooKeeper. Cela peut être un leader ou un nœud suiveur. Une fois qu'un client est connecté, le nœud attribue un ID de session au client particulier et envoie un accusé de réception au client. Si le client n'obtient pas d'accusé de réception, il essaie simplement de connecter un autre nœud dans l'ensemble ZooKeeper. Une fois connecté à un nœud, le client enverra des battements de cœur au nœud à intervalles réguliers pour s'assurer que la connexion n'est pas perdue.

  • If a client wants to read a particular znode, ça envoie un read requestau nœud avec le chemin du znode et le nœud renvoie le znode demandé en le récupérant à partir de sa propre base de données. Pour cette raison, les lectures sont rapides dans l'ensemble ZooKeeper.

  • If a client wants to store data in the ZooKeeper ensemble, il envoie le chemin znode et les données au serveur. Le serveur connecté transmettra la demande au leader, puis le leader réémettra la demande d'écriture à tous les suiveurs. Si seule la majorité des nœuds répondent avec succès, la demande d'écriture réussira et un code de retour réussi sera envoyé au client. Sinon, la demande d'écriture échouera. La stricte majorité des nœuds est appeléeQuorum.

Nœuds dans un ensemble ZooKeeper

Analysons l'effet d'avoir un nombre différent de nœuds dans l'ensemble ZooKeeper.

  • Si nous avons a single node, puis l'ensemble ZooKeeper échoue lorsque ce nœud échoue. Il contribue au «point de défaillance unique» et n'est pas recommandé dans un environnement de production.

  • Si nous avons two nodes et un nœud échoue, nous n'avons pas non plus la majorité, car un sur deux n'est pas une majorité.

  • Si nous avons three nodeset un nœud échoue, nous avons la majorité et donc, c'est l'exigence minimale. Il est obligatoire pour un ensemble ZooKeeper d'avoir au moins trois nœuds dans un environnement de production en direct.

  • Si nous avons four nodeset deux nœuds échouent, cela échoue à nouveau et cela revient à avoir trois nœuds. Le nœud supplémentaire ne sert à rien et il est donc préférable d'ajouter des nœuds en nombres impairs, par exemple 3, 5, 7.

Nous savons qu'un processus d'écriture coûte cher qu'un processus de lecture dans l'ensemble ZooKeeper, puisque tous les nœuds doivent écrire les mêmes données dans sa base de données. Il est donc préférable d'avoir moins de nœuds (3, 5 ou 7) que d'avoir un grand nombre de nœuds pour un environnement équilibré.

Le diagramme suivant décrit le ZooKeeper WorkFlow et le tableau suivant explique ses différents composants.

Composant La description
Écrire Le processus d'écriture est géré par le nœud principal. Le leader transmet la demande d'écriture à tous les znodes et attend les réponses des znodes. Si la moitié des znodes répondent, le processus d'écriture est terminé.
Lis Les lectures sont effectuées en interne par un znode connecté spécifique, il n'est donc pas nécessaire d'interagir avec le cluster.
Base de données répliquée Il est utilisé pour stocker des données dans zookeeper. Chaque znode a sa propre base de données et chaque znode a les mêmes données à chaque fois avec l'aide de la cohérence.
Chef Leader est le Znode qui est responsable du traitement des demandes d'écriture.
Disciple Les abonnés reçoivent des demandes d'écriture des clients et les transmettent au znode leader.
Processeur de demande Présent uniquement dans le nœud principal. Il régit les demandes d'écriture du nœud suiveur.
Diffusions atomiques Responsable de la diffusion des modifications du nœud leader vers les nœuds suiveurs.

Analysons comment un nœud leader peut être élu dans un ensemble ZooKeeper. Considérez qu'il y aNnombre de nœuds dans un cluster. Le processus d'élection du chef est le suivant -

  • Tous les nœuds créent un znode séquentiel et éphémère avec le même chemin, /app/leader_election/guid_.

  • L'ensemble ZooKeeper ajoutera le numéro de séquence à 10 chiffres au chemin et le znode créé sera /app/leader_election/guid_0000000001, /app/leader_election/guid_0000000002, etc.

  • Pour une instance donnée, le nœud qui crée le plus petit nombre dans le znode devient le leader et tous les autres nœuds sont des suiveurs.

  • Chaque nœud suiveur regarde le znode ayant le plus petit nombre suivant. Par exemple, le nœud qui crée znode/app/leader_election/guid_0000000008 va regarder le znode /app/leader_election/guid_0000000007 et le nœud qui crée le znode /app/leader_election/guid_0000000007 va regarder le znode /app/leader_election/guid_0000000006.

  • Si le leader tombe en panne, alors son znode correspondant /app/leader_electionN est supprimé.

  • Le prochain nœud suiveur en ligne recevra la notification via Watcher concernant la suppression du leader.

  • Le prochain nœud suiveur en ligne vérifiera s'il existe d'autres znodes avec le plus petit nombre. Si aucun, alors il assumera le rôle de leader. Sinon, il trouve le nœud qui a créé le znode avec le plus petit nombre comme leader.

  • De même, tous les autres nœuds suiveurs élisent le nœud qui a créé le znode avec le plus petit nombre comme leader.

L'élection du chef est un processus complexe lorsqu'elle est faite à partir de zéro. Mais le service ZooKeeper le rend très simple. Passons à l'installation de ZooKeeper à des fins de développement dans le chapitre suivant.

Avant d'installer ZooKeeper, assurez-vous que votre système fonctionne sur l'un des systèmes d'exploitation suivants:

  • Any of Linux OS- Prend en charge le développement et le déploiement. Il est préférable pour les applications de démonstration.

  • Windows OS - Prend en charge uniquement le développement.

  • Mac OS - Prend en charge uniquement le développement.

Le serveur ZooKeeper est créé en Java et s'exécute sur JVM. Vous devez utiliser JDK 6 ou supérieur.

Maintenant, suivez les étapes ci-dessous pour installer le framework ZooKeeper sur votre machine.

Étape 1: vérification de l'installation de Java

Nous pensons que vous avez déjà un environnement Java installé sur votre système. Vérifiez-le simplement en utilisant la commande suivante.

$ java -version

Si Java est installé sur votre machine, vous pouvez voir la version de Java installé. Sinon, suivez les étapes simples ci-dessous pour installer la dernière version de Java.

Étape 1.1: Téléchargez JDK

Téléchargez la dernière version de JDK en visitant le lien suivant et téléchargez la dernière version. Java

La dernière version (lors de l'écriture de ce tutoriel) est JDK 8u 60 et le fichier est «jdk-8u60-linuxx64.tar.gz». Veuillez télécharger le fichier sur votre machine.

Étape 1.2: Extraire les fichiers

En règle générale, les fichiers sont téléchargés sur le downloadsdossier. Vérifiez-le et extrayez la configuration tar à l'aide des commandes suivantes.

$ cd /go/to/download/path
$ tar -zxf jdk-8u60-linux-x64.gz

Étape 1.3: Déplacer vers le répertoire opt

Pour rendre Java disponible à tous les utilisateurs, déplacez le contenu java extrait vers le dossier «/ usr / local / java».

$ su 
password: (type password of root user)
$ mkdir /opt/jdk $ mv jdk-1.8.0_60 /opt/jdk/

Étape 1.4: définir le chemin

Pour définir les variables path et JAVA_HOME, ajoutez les commandes suivantes au fichier ~ / .bashrc.

export JAVA_HOME = /usr/jdk/jdk-1.8.0_60
export PATH=$PATH:$JAVA_HOME/bin

Maintenant, appliquez toutes les modifications dans le système en cours d'exécution.

$ source ~/.bashrc

Étape 1.5: Alternatives Java

Utilisez la commande suivante pour modifier les alternatives Java.

update-alternatives --install /usr/bin/java java /opt/jdk/jdk1.8.0_60/bin/java 100

Étape 1.6

Vérifiez l'installation de Java à l'aide de la commande de vérification (java -version) expliqué à l'étape 1.

Étape 2: Installation de ZooKeeper Framework

Étape 2.1: Téléchargez ZooKeeper

Pour installer le framework ZooKeeper sur votre ordinateur, visitez le lien suivant et téléchargez la dernière version de ZooKeeper. http://zookeeper.apache.org/releases.html

À partir de maintenant, la dernière version de ZooKeeper est la 3.4.6 (ZooKeeper-3.4.6.tar.gz).

Étape 2.2: Extraire le fichier tar

Extrayez le fichier tar à l'aide des commandes suivantes -

$ cd opt/
$ tar -zxf zookeeper-3.4.6.tar.gz $ cd zookeeper-3.4.6
$ mkdir data

Étape 2.3: Créer un fichier de configuration

Ouvrez le fichier de configuration nommé conf/zoo.cfg en utilisant la commande vi conf/zoo.cfg et tous les paramètres suivants à définir comme point de départ.

$ vi conf/zoo.cfg

tickTime = 2000
dataDir = /path/to/zookeeper/data
clientPort = 2181
initLimit = 5
syncLimit = 2

Une fois que le fichier de configuration a été enregistré avec succès, retournez à nouveau au terminal. Vous pouvez maintenant démarrer le serveur zookeeper.

Étape 2.4: Démarrez le serveur ZooKeeper

Exécutez la commande suivante -

$ bin/zkServer.sh start

Après avoir exécuté cette commande, vous obtiendrez une réponse comme suit -

$ JMX enabled by default
$ Using config: /Users/../zookeeper-3.4.6/bin/../conf/zoo.cfg $ Starting zookeeper ... STARTED

Étape 2.5: Démarrez CLI

Tapez la commande suivante -

$ bin/zkCli.sh

Après avoir tapé la commande ci-dessus, vous serez connecté au serveur ZooKeeper et vous devriez obtenir la réponse suivante.

Connecting to localhost:2181
................
................
................
Welcome to ZooKeeper!
................
................
WATCHER::
WatchedEvent state:SyncConnected type: None path:null
[zk: localhost:2181(CONNECTED) 0]

Arrêter le serveur ZooKeeper

Après avoir connecté le serveur et effectué toutes les opérations, vous pouvez arrêter le serveur zookeeper à l'aide de la commande suivante.

$ bin/zkServer.sh stop

L'interface de ligne de commande (CLI) de ZooKeeper est utilisée pour interagir avec l'ensemble ZooKeeper à des fins de développement. C'est utile pour le débogage et travailler avec différentes options.

Pour effectuer les opérations CLI ZooKeeper, allumez d'abord votre serveur ZooKeeper ( «bin / zkServer.sh start» ), puis le client ZooKeeper ( «bin / zkCli.sh» ). Une fois le client démarré, vous pouvez effectuer l'opération suivante -

  • Créer des znodes
  • Obtenez des données
  • Surveillez znode pour les changements
  • Définir les données
  • Créer des enfants d'un znode
  • Lister les enfants d'un znode
  • Vérifier l'état
  • Supprimer / Supprimer un znode

Voyons maintenant la commande ci-dessus une par une avec un exemple.

Créer des Znodes

Créez un znode avec le chemin donné. leflagL'argument spécifie si le znode créé sera éphémère, persistant ou séquentiel. Par défaut, tous les znodes sont persistants.

  • Ephemeral znodes (indicateur: e) sera automatiquement supprimé lorsqu'une session expire ou lorsque le client se déconnecte.

  • Sequential znodes garantir que le chemin du znode sera unique.

  • L'ensemble ZooKeeper ajoutera un numéro de séquence avec un remplissage de 10 chiffres au chemin znode. Par exemple, le chemin znode / myapp sera converti en / myapp0000000001 et le numéro de séquence suivant sera / myapp0000000002 . Si aucun indicateur n'est spécifié, le znode est considéré commepersistent.

Syntaxe

create /path /data

Échantillon

create /FirstZnode “Myfirstzookeeper-app”

Production

[zk: localhost:2181(CONNECTED) 0] create /FirstZnode “Myfirstzookeeper-app”
Created /FirstZnode

Créer un Sequential znode, ajouter -s flag comme indiqué ci-dessous.

Syntaxe

create -s /path /data

Échantillon

create -s /FirstZnode second-data

Production

[zk: localhost:2181(CONNECTED) 2] create -s /FirstZnode “second-data”
Created /FirstZnode0000000023

Pour créer un Ephemeral Znode, ajouter -e flag comme indiqué ci-dessous.

Syntaxe

create -e /path /data

Échantillon

create -e /SecondZnode “Ephemeral-data”

Production

[zk: localhost:2181(CONNECTED) 2] create -e /SecondZnode “Ephemeral-data”
Created /SecondZnode

N'oubliez pas que lorsqu'une connexion client est perdue, le znode éphémère sera supprimé. Vous pouvez l'essayer en quittant la CLI ZooKeeper, puis en rouvrant la CLI.

Obtenir des données

Il renvoie les données associées du znode et les métadonnées du znode spécifié. Vous obtiendrez des informations telles que la date de la dernière modification des données, l'endroit où elles ont été modifiées et des informations sur les données. Cette CLI est également utilisée pour attribuer des montres pour afficher une notification sur les données.

Syntaxe

get /path

Échantillon

get /FirstZnode

Production

[zk: localhost:2181(CONNECTED) 1] get /FirstZnode
“Myfirstzookeeper-app”
cZxid = 0x7f
ctime = Tue Sep 29 16:15:47 IST 2015
mZxid = 0x7f
mtime = Tue Sep 29 16:15:47 IST 2015
pZxid = 0x7f
cversion = 0
dataVersion = 0
aclVersion = 0
ephemeralOwner = 0x0
dataLength = 22
numChildren = 0

Pour accéder à un znode séquentiel, vous devez entrer le chemin complet du znode.

Échantillon

get /FirstZnode0000000023

Production

[zk: localhost:2181(CONNECTED) 1] get /FirstZnode0000000023
“Second-data”
cZxid = 0x80
ctime = Tue Sep 29 16:25:47 IST 2015
mZxid = 0x80
mtime = Tue Sep 29 16:25:47 IST 2015
pZxid = 0x80
cversion = 0
dataVersion = 0
aclVersion = 0
ephemeralOwner = 0x0
dataLength = 13
numChildren = 0

Regarder

Les montres affichent une notification lorsque les données enfants du znode ou du znode spécifié changent. Vous pouvez définir unwatch seulement dans get commander.

Syntaxe

get /path [watch] 1

Échantillon

get /FirstZnode 1

Production

[zk: localhost:2181(CONNECTED) 1] get /FirstZnode 1
“Myfirstzookeeper-app”
cZxid = 0x7f
ctime = Tue Sep 29 16:15:47 IST 2015
mZxid = 0x7f
mtime = Tue Sep 29 16:15:47 IST 2015
pZxid = 0x7f
cversion = 0
dataVersion = 0
aclVersion = 0
ephemeralOwner = 0x0
dataLength = 22
numChildren = 0

La sortie est similaire à la normale getcommande, mais il attendra les changements de znode en arrière-plan. <Commencez ici>

Définir les données

Définissez les données du znode spécifié. Une fois que vous avez terminé cette opération de réglage, vous pouvez vérifier les données à l'aide duget Commande CLI.

Syntaxe

set /path /data

Échantillon

set /SecondZnode Data-updated

Production

[zk: localhost:2181(CONNECTED) 1] get /SecondZnode “Data-updated”
cZxid = 0x82
ctime = Tue Sep 29 16:29:50 IST 2015
mZxid = 0x83
mtime = Tue Sep 29 16:29:50 IST 2015
pZxid = 0x82
cversion = 0
dataVersion = 1
aclVersion = 0
ephemeralOwner = 0x15018b47db00000
dataLength = 14
numChildren = 0

Si vous avez attribué watch option dans get commande (comme dans la commande précédente), la sortie sera similaire comme indiqué ci-dessous -

Production

[zk: localhost:2181(CONNECTED) 1] get /FirstZnode “Mysecondzookeeper-app”

WATCHER: :

WatchedEvent state:SyncConnected type:NodeDataChanged path:/FirstZnode
cZxid = 0x7f
ctime = Tue Sep 29 16:15:47 IST 2015
mZxid = 0x84
mtime = Tue Sep 29 17:14:47 IST 2015
pZxid = 0x7f
cversion = 0
dataVersion = 1
aclVersion = 0
ephemeralOwner = 0x0
dataLength = 23
numChildren = 0

Créer des enfants / sous-znode

La création d'enfants est similaire à la création de nouveaux znodes. La seule différence est que le chemin du znode enfant aura également le chemin parent.

Syntaxe

create /parent/path/subnode/path /data

Échantillon

create /FirstZnode/Child1 firstchildren

Production

[zk: localhost:2181(CONNECTED) 16] create /FirstZnode/Child1 “firstchildren”
created /FirstZnode/Child1
[zk: localhost:2181(CONNECTED) 17] create /FirstZnode/Child2 “secondchildren”
created /FirstZnode/Child2

Liste des enfants

Cette commande permet de lister et d'afficher les children d'un znode.

Syntaxe

ls /path

Échantillon

ls /MyFirstZnode

Production

[zk: localhost:2181(CONNECTED) 2] ls /MyFirstZnode
[mysecondsubnode, myfirstsubnode]

Vérifier l'état

Statusdécrit les métadonnées d'un znode spécifié. Il contient des détails tels que l'horodatage, le numéro de version, l'ACL, la longueur des données et le znode des enfants.

Syntaxe

stat /path

Échantillon

stat /FirstZnode

Production

[zk: localhost:2181(CONNECTED) 1] stat /FirstZnode
cZxid = 0x7f
ctime = Tue Sep 29 16:15:47 IST 2015
mZxid = 0x7f
mtime = Tue Sep 29 17:14:24 IST 2015
pZxid = 0x7f
cversion = 0
dataVersion = 1
aclVersion = 0
ephemeralOwner = 0x0
dataLength = 23
numChildren = 0

Supprimer un Znode

Supprime un znode spécifié et de manière récursive tous ses enfants. Cela ne se produirait que si un tel znode est disponible.

Syntaxe

rmr /path

Échantillon

rmr /FirstZnode

Production

[zk: localhost:2181(CONNECTED) 10] rmr /FirstZnode
[zk: localhost:2181(CONNECTED) 11] get /FirstZnode
Node does not exist: /FirstZnode

Effacer (delete /path) la commande est similaire à remove commande, sauf le fait qu'elle ne fonctionne que sur les znodes sans enfants.

ZooKeeper a une liaison API officielle pour Java et C. La communauté ZooKeeper fournit une API non officielle pour la plupart des langages (.NET, python, etc.). Grâce à l'API ZooKeeper, une application peut se connecter, interagir, manipuler des données, coordonner et enfin se déconnecter d'un ensemble ZooKeeper.

L'API ZooKeeper dispose d'un riche ensemble de fonctionnalités pour obtenir toutes les fonctionnalités de l'ensemble ZooKeeper de manière simple et sûre. L'API ZooKeeper fournit des méthodes synchrones et asynchrones.

L'ensemble ZooKeeper et l'API ZooKeeper se complètent complètement dans tous les aspects et bénéficient aux développeurs d'une grande manière. Parlons de la liaison Java dans ce chapitre.

Principes de base de l'API ZooKeeper

L'application interagissant avec l'ensemble ZooKeeper est appelée ZooKeeper Client ou simplement Client.

Znode est le composant principal de l'ensemble ZooKeeper et l'API ZooKeeper fournit un petit ensemble de méthodes pour manipuler tous les détails de znode avec l'ensemble ZooKeeper.

Un client doit suivre les étapes ci-dessous pour avoir une interaction claire et propre avec l'ensemble ZooKeeper.

  • Connectez-vous à l'ensemble ZooKeeper. L'ensemble ZooKeeper attribue un ID de session au client.

  • Envoyez régulièrement des pulsations au serveur. Sinon, l'ensemble ZooKeeper expire l'ID de session et le client doit se reconnecter.

  • Obtenez / définissez les znodes tant qu'un ID de session est actif.

  • Déconnectez-vous de l'ensemble ZooKeeper, une fois toutes les tâches terminées. Si le client est inactif pendant une période prolongée, l'ensemble ZooKeeper déconnecte automatiquement le client.

Liaison Java

Laissez-nous comprendre l'ensemble le plus important d'API ZooKeeper dans ce chapitre. La partie centrale de l'API ZooKeeper estZooKeeper class. Il fournit des options pour connecter l'ensemble ZooKeeper dans son constructeur et dispose des méthodes suivantes -

  • connect - se connecter à l'ensemble ZooKeeper

  • create - créer un znode

  • exists - vérifier si un znode existe et ses informations

  • getData - obtenir des données d'un znode particulier

  • setData - définir les données dans un znode particulier

  • getChildren - obtenir tous les sous-nœuds disponibles dans un znode particulier

  • delete - obtenir un znode particulier et tous ses enfants

  • close - fermer une connexion

Connectez-vous à l'ensemble ZooKeeper

La classe ZooKeeper fournit des fonctionnalités de connexion via son constructeur. La signature du constructeur est la suivante -

ZooKeeper(String connectionString, int sessionTimeout, Watcher watcher)

Où,

  • connectionString - Hôte de l'ensemble ZooKeeper.

  • sessionTimeout - délai d'expiration de la session en millisecondes.

  • watcher- un objet implémentant l'interface «Watcher». L'ensemble ZooKeeper renvoie l'état de la connexion via l'objet observateur.

Créons une nouvelle classe d'assistance ZooKeeperConnection et ajoutez une méthode connect. leconnect crée un objet ZooKeeper, se connecte à l'ensemble ZooKeeper, puis retourne l'objet.

Ici CountDownLatch est utilisé pour arrêter (attendre) le processus principal jusqu'à ce que le client se connecte à l'ensemble ZooKeeper.

L'ensemble ZooKeeper répond à l'état de la connexion via le Watcher callback. Le rappel Watcher sera appelé une fois que le client se connectera à l'ensemble ZooKeeper et que le rappel Watcher appellera lecountDown méthode de la CountDownLatch pour libérer la serrure, await dans le processus principal.

Voici le code complet pour se connecter à un ensemble ZooKeeper.

Codage: ZooKeeperConnection.java

// import java classes
import java.io.IOException;
import java.util.concurrent.CountDownLatch;

// import zookeeper classes
import org.apache.zookeeper.KeeperException;
import org.apache.zookeeper.WatchedEvent;
import org.apache.zookeeper.Watcher;
import org.apache.zookeeper.Watcher.Event.KeeperState;
import org.apache.zookeeper.ZooKeeper;
import org.apache.zookeeper.AsyncCallback.StatCallback;
import org.apache.zookeeper.KeeperException.Code;
import org.apache.zookeeper.data.Stat;

public class ZooKeeperConnection {

   // declare zookeeper instance to access ZooKeeper ensemble
   private ZooKeeper zoo;
   final CountDownLatch connectedSignal = new CountDownLatch(1);

   // Method to connect zookeeper ensemble.
   public ZooKeeper connect(String host) throws IOException,InterruptedException {
	
      zoo = new ZooKeeper(host,5000,new Watcher() {
		
         public void process(WatchedEvent we) {

            if (we.getState() == KeeperState.SyncConnected) {
               connectedSignal.countDown();
            }
         }
      });
		
      connectedSignal.await();
      return zoo;
   }

   // Method to disconnect from zookeeper server
   public void close() throws InterruptedException {
      zoo.close();
   }
}

Enregistrez le code ci-dessus et il sera utilisé dans la section suivante pour connecter l'ensemble ZooKeeper.

Créer un Znode

La classe ZooKeeper fournit create methodpour créer un nouveau znode dans l'ensemble ZooKeeper. La signature ducreate la méthode est la suivante -

create(String path, byte[] data, List<ACL> acl, CreateMode createMode)

Où,

  • path- Chemin Znode. Par exemple, / myapp1, / ​​myapp2, / myapp1 / mydata1, myapp2 / mydata1 / myanothersubdata

  • data - données à stocker dans un chemin znode spécifié

  • acl- liste de contrôle d'accès du nœud à créer. L'API ZooKeeper fournit une interface statiqueZooDefs.Idspour obtenir une partie de la liste acl de base. Par exemple, ZooDefs.Ids.OPEN_ACL_UNSAFE renvoie une liste d'acl pour les znodes ouverts.

  • createMode- le type de nœud, éphémère, séquentiel ou les deux. C'est unenum.

Créons une nouvelle application Java pour vérifier le createfonctionnalité de l'API ZooKeeper. Créer un fichierZKCreate.java. Dans la méthode principale, créez un objet de typeZooKeeperConnection et appelez le connect méthode pour se connecter à l'ensemble ZooKeeper.

La méthode connect renverra l'objet ZooKeeper zk. Maintenant, appelez lecreate méthode de zk objet avec personnalisé path et data.

Le code de programme complet pour créer un znode est le suivant -

Codage: ZKCreate.java

import java.io.IOException;

import org.apache.zookeeper.WatchedEvent;
import org.apache.zookeeper.Watcher;
import org.apache.zookeeper.Watcher.Event.KeeperState;
import org.apache.zookeeper.ZooKeeper;
import org.apache.zookeeper.KeeperException;
import org.apache.zookeeper.CreateMode;
import org.apache.zookeeper.ZooDefs;

public class ZKCreate {
   // create static instance for zookeeper class.
   private static ZooKeeper zk;

   // create static instance for ZooKeeperConnection class.
   private static ZooKeeperConnection conn;

   // Method to create znode in zookeeper ensemble
   public static void create(String path, byte[] data) throws 
      KeeperException,InterruptedException {
      zk.create(path, data, ZooDefs.Ids.OPEN_ACL_UNSAFE,
      CreateMode.PERSISTENT);
   }

   public static void main(String[] args) {

      // znode path
      String path = "/MyFirstZnode"; // Assign path to znode

      // data in byte array
      byte[] data = "My first zookeeper app”.getBytes(); // Declare data
		
      try {
         conn = new ZooKeeperConnection();
         zk = conn.connect("localhost");
         create(path, data); // Create the data to the specified path
         conn.close();
      } catch (Exception e) {
         System.out.println(e.getMessage()); //Catch error message
      }
   }
}

Une fois l'application compilée et exécutée, un znode avec les données spécifiées sera créé dans l'ensemble ZooKeeper. Vous pouvez le vérifier à l'aide de la CLI ZooKeeperzkCli.sh.

cd /path/to/zookeeper
bin/zkCli.sh
>>> get /MyFirstZnode

Exists - Vérifier l'existence d'un Znode

La classe ZooKeeper fournit le exists methodpour vérifier l'existence d'un znode. Il renvoie les métadonnées d'un znode, si le znode spécifié existe. La signature duexists la méthode est la suivante -

exists(String path, boolean watcher)

Où,

  • path - Chemin Znode

  • watcher - valeur booléenne pour spécifier s'il faut regarder un znode spécifié ou non

Créons une nouvelle application Java pour vérifier la fonctionnalité «existe» de l'API ZooKeeper. Créez un fichier «ZKExists.java» . Dans la méthode principale, créez l'objet ZooKeeper, «zk» à l' aide de l' objet «ZooKeeperConnection» . Ensuite, appel « existe » méthode de « ZK » objet à la coutume « chemin » . La liste complète est la suivante -

Codage: ZKExists.java

import java.io.IOException;

import org.apache.zookeeper.ZooKeeper;
import org.apache.zookeeper.KeeperException;
import org.apache.zookeeper.WatchedEvent;
import org.apache.zookeeper.Watcher;
import org.apache.zookeeper.Watcher.Event.KeeperState;
import org.apache.zookeeper.data.Stat;

public class ZKExists {
   private static ZooKeeper zk;
   private static ZooKeeperConnection conn;

   // Method to check existence of znode and its status, if znode is available.
   public static Stat znode_exists(String path) throws
      KeeperException,InterruptedException {
      return zk.exists(path, true);
   }

   public static void main(String[] args) throws InterruptedException,KeeperException {
      String path = "/MyFirstZnode"; // Assign znode to the specified path
			
      try {
         conn = new ZooKeeperConnection();
         zk = conn.connect("localhost");
         Stat stat = znode_exists(path); // Stat checks the path of the znode
				
         if(stat != null) {
            System.out.println("Node exists and the node version is " +
            stat.getVersion());
         } else {
            System.out.println("Node does not exists");
         }
				
      } catch(Exception e) {
         System.out.println(e.getMessage()); // Catches error messages
      }
   }
}

Une fois l'application compilée et exécutée, vous obtiendrez la sortie ci-dessous.

Node exists and the node version is 1.

getData, méthode

La classe ZooKeeper fournit getDataméthode pour obtenir les données attachées dans un znode spécifié et son état. La signature dugetData la méthode est la suivante -

getData(String path, Watcher watcher, Stat stat)

Où,

  • path - Chemin Znode.

  • watcher - Fonction de rappel de type Watcher. L'ensemble ZooKeeper notifie via le rappel Watcher lorsque les données du znode spécifié changent. Il s'agit d'une notification unique.

  • stat - Renvoie les métadonnées d'un znode.

Créons une nouvelle application Java pour comprendre le getDatafonctionnalité de l'API ZooKeeper. Créer un fichierZKGetData.java. Dans la méthode principale, créez un objet ZooKeeperzk en utilisant il ZooKeeperConnectionobjet. Ensuite, appelez legetData méthode de l'objet zk avec chemin personnalisé.

Voici le code du programme complet pour obtenir les données d'un nœud spécifié -

Codage: ZKGetData.java

import java.io.IOException;
import java.util.concurrent.CountDownLatch;

import org.apache.zookeeper.ZooKeeper;
import org.apache.zookeeper.KeeperException;
import org.apache.zookeeper.WatchedEvent;
import org.apache.zookeeper.Watcher;
import org.apache.zookeeper.Watcher.Event.KeeperState;
import org.apache.zookeeper.data.Stat;

public class ZKGetData {

   private static ZooKeeper zk;
   private static ZooKeeperConnection conn;
   public static Stat znode_exists(String path) throws 
      KeeperException,InterruptedException {
      return zk.exists(path,true);
   }

   public static void main(String[] args) throws InterruptedException, KeeperException {
      String path = "/MyFirstZnode";
      final CountDownLatch connectedSignal = new CountDownLatch(1);
		
      try {
         conn = new ZooKeeperConnection();
         zk = conn.connect("localhost");
         Stat stat = znode_exists(path);
			
         if(stat != null) {
            byte[] b = zk.getData(path, new Watcher() {
				
               public void process(WatchedEvent we) {
					
                  if (we.getType() == Event.EventType.None) {
                     switch(we.getState()) {
                        case Expired:
                        connectedSignal.countDown();
                        break;
                     }
							
                  } else {
                     String path = "/MyFirstZnode";
							
                     try {
                        byte[] bn = zk.getData(path,
                        false, null);
                        String data = new String(bn,
                        "UTF-8");
                        System.out.println(data);
                        connectedSignal.countDown();
							
                     } catch(Exception ex) {
                        System.out.println(ex.getMessage());
                     }
                  }
               }
            }, null);
				
            String data = new String(b, "UTF-8");
            System.out.println(data);
            connectedSignal.await();
				
         } else {
            System.out.println("Node does not exists");
         }
      } catch(Exception e) {
        System.out.println(e.getMessage());
      }
   }
}

Une fois l'application compilée et exécutée, vous obtiendrez le résultat suivant

My first zookeeper app

Et l'application attendra une autre notification de l'ensemble ZooKeeper. Modifier les données du znode spécifié à l'aide de la CLI ZooKeeperzkCli.sh.

cd /path/to/zookeeper
bin/zkCli.sh
>>> set /MyFirstZnode Hello

Maintenant, l'application imprimera la sortie suivante et se fermera.

Hello

setData, méthode

La classe ZooKeeper fournit setDataméthode pour modifier les données attachées dans un znode spécifié. La signature dusetData la méthode est la suivante -

setData(String path, byte[] data, int version)

Où,

  • path - Chemin Znode

  • data - données à stocker dans un chemin znode spécifié.

  • version- Version actuelle du znode. ZooKeeper met à jour le numéro de version du znode chaque fois que les données sont modifiées.

Créons maintenant une nouvelle application Java pour comprendre le setDatafonctionnalité de l'API ZooKeeper. Créer un fichierZKSetData.java. Dans la méthode principale, créez un objet ZooKeeperzk en utilisant le ZooKeeperConnectionobjet. Ensuite, appelez lesetData méthode de zk objet avec le chemin spécifié, les nouvelles données et la version du nœud.

Voici le code du programme complet pour modifier les données attachées dans un znode spécifié.

Code: ZKSetData.java

import org.apache.zookeeper.ZooKeeper;
import org.apache.zookeeper.KeeperException;
import org.apache.zookeeper.WatchedEvent;
import org.apache.zookeeper.Watcher;
import org.apache.zookeeper.Watcher.Event.KeeperState;

import java.io.IOException;

public class ZKSetData {
   private static ZooKeeper zk;
   private static ZooKeeperConnection conn;

   // Method to update the data in a znode. Similar to getData but without watcher.
   public static void update(String path, byte[] data) throws
      KeeperException,InterruptedException {
      zk.setData(path, data, zk.exists(path,true).getVersion());
   }

   public static void main(String[] args) throws InterruptedException,KeeperException {
      String path= "/MyFirstZnode";
      byte[] data = "Success".getBytes(); //Assign data which is to be updated.
		
      try {
         conn = new ZooKeeperConnection();
         zk = conn.connect("localhost");
         update(path, data); // Update znode data to the specified path
      } catch(Exception e) {
         System.out.println(e.getMessage());
      }
   }
}

Une fois l'application compilée et exécutée, les données du znode spécifié seront modifiées et pourront être vérifiées à l'aide de la CLI ZooKeeper, zkCli.sh.

cd /path/to/zookeeper
bin/zkCli.sh
>>> get /MyFirstZnode

getChildrenMethod

La classe ZooKeeper fournit getChildrenméthode pour obtenir tous les sous-nœuds d'un znode particulier. La signature dugetChildren la méthode est la suivante -

getChildren(String path, Watcher watcher)

Où,

  • path - Chemin Znode.

  • watcher- Fonction de rappel de type «Watcher». L'ensemble ZooKeeper notifiera lorsque le znode spécifié est supprimé ou qu'un enfant sous le znode est créé / supprimé. Ceci est une notification unique.

Codage: ZKGetChildren.java

import java.io.IOException;
import java.util.*;

import org.apache.zookeeper.ZooKeeper;
import org.apache.zookeeper.KeeperException;
import org.apache.zookeeper.WatchedEvent;
import org.apache.zookeeper.Watcher;
import org.apache.zookeeper.Watcher.Event.KeeperState;
import org.apache.zookeeper.data.Stat;

public class ZKGetChildren {
   private static ZooKeeper zk;
   private static ZooKeeperConnection conn;

   // Method to check existence of znode and its status, if znode is available.
   public static Stat znode_exists(String path) throws 
      KeeperException,InterruptedException {
      return zk.exists(path,true);
   }

   public static void main(String[] args) throws InterruptedException,KeeperException {
      String path = "/MyFirstZnode"; // Assign path to the znode
		
      try {
         conn = new ZooKeeperConnection();
         zk = conn.connect("localhost");
         Stat stat = znode_exists(path); // Stat checks the path

         if(stat!= null) {

            //“getChildren” method- get all the children of znode.It has two
            args, path and watch
            List <String> children = zk.getChildren(path, false);
            for(int i = 0; i < children.size(); i++)
            System.out.println(children.get(i)); //Print children's
         } else {
            System.out.println("Node does not exists");
         }

      } catch(Exception e) {
         System.out.println(e.getMessage());
      }

   }

}

Avant d'exécuter le programme, créons deux sous-nœuds pour /MyFirstZnode à l'aide de la CLI ZooKeeper, zkCli.sh.

cd /path/to/zookeeper
bin/zkCli.sh
>>> create /MyFirstZnode/myfirstsubnode Hi
>>> create /MyFirstZnode/mysecondsubmode Hi

Maintenant, la compilation et l'exécution du programme produiront les znodes créés ci-dessus.

myfirstsubnode
mysecondsubnode

Supprimer un Znode

La classe ZooKeeper fournit deleteméthode pour supprimer un znode spécifié. La signature dudelete la méthode est la suivante -

delete(String path, int version)

Où,

  • path - Chemin Znode.

  • version - Version actuelle du znode.

Créons une nouvelle application Java pour comprendre le deletefonctionnalité de l'API ZooKeeper. Créer un fichierZKDelete.java. Dans la méthode principale, créez un objet ZooKeeperzk en utilisant ZooKeeperConnectionobjet. Ensuite, appelez ledelete méthode de zk objet avec le spécifié path et la version du nœud.

Le code de programme complet pour supprimer un znode est le suivant -

Codage: ZKDelete.java

import org.apache.zookeeper.ZooKeeper;
import org.apache.zookeeper.KeeperException;

public class ZKDelete {
   private static ZooKeeper zk;
   private static ZooKeeperConnection conn;

   // Method to check existence of znode and its status, if znode is available.
   public static void delete(String path) throws KeeperException,InterruptedException {
      zk.delete(path,zk.exists(path,true).getVersion());
   }

   public static void main(String[] args) throws InterruptedException,KeeperException {
      String path = "/MyFirstZnode"; //Assign path to the znode
		
      try {
         conn = new ZooKeeperConnection();
         zk = conn.connect("localhost");
         delete(path); //delete the node with the specified path
      } catch(Exception e) {
         System.out.println(e.getMessage()); // catches error messages
      }
   }
}

Zookeeper fournit une infrastructure de coordination flexible pour un environnement distribué. Le framework ZooKeeper prend en charge la plupart des meilleures applications industrielles d'aujourd'hui. Nous discuterons de certaines des applications les plus notables de ZooKeeper dans ce chapitre.

Yahoo!

Le framework ZooKeeper a été construit à l'origine chez «Yahoo!». Une application distribuée bien conçue doit répondre à des exigences telles que la transparence des données, de meilleures performances, la robustesse, la configuration centralisée et la coordination. Ainsi, ils ont conçu le framework ZooKeeper pour répondre à ces exigences.

Apache Hadoop

Apache Hadoop est le moteur de la croissance de l'industrie du Big Data. Hadoop s'appuie sur ZooKeeper pour la gestion et la coordination de la configuration. Prenons un scénario pour comprendre le rôle de ZooKeeper dans Hadoop.

Supposons qu'un Hadoop cluster des ponts 100 or more commodity servers. Par conséquent, des services de coordination et de dénomination sont nécessaires. Comme le calcul d'un grand nombre de nœuds est impliqué, chaque nœud doit se synchroniser, savoir où accéder aux services et savoir comment ils doivent être configurés. À ce stade, les clusters Hadoop nécessitent des services inter-nœuds. ZooKeeper fournit les installations pourcross-node synchronization et s'assure que les tâches des projets Hadoop sont sérialisées et synchronisées.

Plusieurs serveurs ZooKeeper prennent en charge de grands clusters Hadoop. Chaque machine cliente communique avec l'un des serveurs ZooKeeper pour récupérer et mettre à jour ses informations de synchronisation. Certains des exemples en temps réel sont -

  • Human Genome Project- Le projet du génome humain contient des téraoctets de données. Le framework Hadoop MapReduce peut être utilisé pour analyser l'ensemble de données et trouver des faits intéressants pour le développement humain.

  • Healthcare - Les hôpitaux peuvent stocker, récupérer et analyser d'énormes ensembles de dossiers médicaux de patients, qui sont normalement en téraoctets.

Apache HBase

Apache HBase est une base de données NoSQL open source, distribuée, utilisée pour l'accès en lecture / écriture en temps réel de grands ensembles de données et s'exécute sur HDFS. HBase suitmaster-slave architectureoù le maître HBase gouverne tous les esclaves. Les esclaves sont appelésRegion servers.

L'installation d'applications distribuées HBase dépend d'un cluster ZooKeeper en cours d'exécution. Apache HBase utilise ZooKeeper pour suivre l'état des données distribuées sur les serveurs maître et régional à l'aide decentralized configuration management et distributed mutexmécanismes. Voici quelques-uns des cas d'utilisation de HBase -

  • Telecom- L'industrie des télécommunications stocke des milliards d'enregistrements d'appels mobiles (environ 30 To / mois) et l'accès à ces enregistrements d'appels en temps réel devient une tâche énorme. HBase peut être utilisé pour traiter tous les enregistrements en temps réel, facilement et efficacement.

  • Social network- Semblable à l'industrie des télécommunications, des sites comme Twitter, LinkedIn et Facebook reçoivent d'énormes volumes de données via les publications créées par les utilisateurs. HBase peut être utilisé pour trouver des tendances récentes et d'autres faits intéressants.

Apache Solr

Apache Solr est une plateforme de recherche rapide et open source écrite en Java. C'est un moteur de recherche distribué ultra-rapide et résistant aux pannes. Construit au-dessus deLucene, il s'agit d'un moteur de recherche de texte très performant et complet.

Solr utilise largement toutes les fonctionnalités de ZooKeeper telles que la gestion de la configuration, l'élection du leader, la gestion des nœuds, le verrouillage et la synchronisation des données.

Solr a deux parties distinctes, indexing et searching. L'indexation est un processus de stockage des données dans un format approprié afin qu'elles puissent être recherchées ultérieurement. Solr utilise ZooKeeper pour à la fois indexer les données dans plusieurs nœuds et rechercher à partir de plusieurs nœuds. ZooKeeper apporte les fonctionnalités suivantes -

  • Ajouter / supprimer des nœuds au besoin

  • Réplication des données entre les nœuds et minimisation ultérieure des pertes de données

  • Partage de données entre plusieurs nœuds et recherche ultérieure à partir de plusieurs nœuds pour des résultats de recherche plus rapides

Certains des cas d'utilisation d'Apache Solr incluent le commerce électronique, la recherche d'emploi, etc.