HBase - Guide rapide
Depuis 1970, le SGBDR est la solution aux problèmes liés au stockage et à la maintenance des données. Après l'avènement du Big Data, les entreprises ont réalisé l'avantage du traitement du Big Data et ont commencé à opter pour des solutions comme Hadoop.
Hadoop utilise un système de fichiers distribué pour stocker des données volumineuses et MapReduce pour les traiter. Hadoop excelle dans le stockage et le traitement d'énormes données de différents formats tels que arbitraires, semi-structurés ou même non structurés.
Limitations de Hadoop
Hadoop ne peut effectuer qu'un traitement par lots et les données ne seront accessibles que de manière séquentielle. Cela signifie qu'il faut rechercher l'ensemble de données, même pour les tâches les plus simples.
Un énorme ensemble de données lorsqu'il est traité entraîne un autre énorme ensemble de données, qui doit également être traité de manière séquentielle. À ce stade, une nouvelle solution est nécessaire pour accéder à n'importe quel point de données en une seule unité de temps (accès aléatoire).
Bases de données à accès aléatoire Hadoop
Des applications telles que HBase, Cassandra, couchDB, Dynamo et MongoDB font partie des bases de données qui stockent d'énormes quantités de données et accèdent aux données de manière aléatoire.
Qu'est-ce que HBase?
HBase est une base de données distribuée orientée colonnes construite sur le système de fichiers Hadoop. Il s'agit d'un projet open source et évolutif horizontalement.
HBase est un modèle de données similaire à la grande table de Google conçu pour fournir un accès aléatoire rapide à d'énormes quantités de données structurées. Il exploite la tolérance aux pannes fournie par le système de fichiers Hadoop (HDFS).
Il fait partie de l'écosystème Hadoop qui fournit un accès aléatoire en lecture / écriture en temps réel aux données du système de fichiers Hadoop.
On peut stocker les données dans HDFS soit directement, soit via HBase. Le consommateur de données lit / accède aux données dans HDFS de manière aléatoire à l'aide de HBase. HBase se trouve au-dessus du système de fichiers Hadoop et fournit un accès en lecture et en écriture.
HBase et HDFS
HDFS | HBase |
---|---|
HDFS est un système de fichiers distribué adapté au stockage de fichiers volumineux. | HBase est une base de données construite sur le HDFS. |
HDFS ne prend pas en charge les recherches rapides d'enregistrements individuels. | HBase fournit des recherches rapides pour des tables plus volumineuses. |
Il fournit un traitement par lots à latence élevée; aucun concept de traitement par lots. | Il fournit un accès à faible latence à des lignes uniques à partir de milliards d'enregistrements (accès aléatoire). |
Il ne fournit qu'un accès séquentiel aux données. | HBase utilise en interne des tables de hachage et fournit un accès aléatoire, et stocke les données dans des fichiers HDFS indexés pour des recherches plus rapides. |
Mécanisme de stockage dans HBase
HBase est un column-oriented databaseet les tableaux qu'il contient sont triés par ligne. Le schéma de table définit uniquement les familles de colonnes, qui sont les paires valeur / clé. Une table a plusieurs familles de colonnes et chaque famille de colonnes peut avoir n'importe quel nombre de colonnes. Les valeurs de colonne suivantes sont stockées de manière contiguë sur le disque. Chaque valeur de cellule de la table a un horodatage. En bref, dans une HBase:
- La table est une collection de lignes.
- Row est une collection de familles de colonnes.
- La famille de colonnes est une collection de colonnes.
- La colonne est une collection de paires valeur / clé.
Ci-dessous, un exemple de schéma de table dans HBase.
Rowid | Famille de colonnes | Famille de colonnes | Famille de colonnes | Famille de colonnes | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
col1 | col2 | col3 | col1 | col2 | col3 | col1 | col2 | col3 | col1 | col2 | col3 | |
1 | ||||||||||||
2 | ||||||||||||
3 |
Orienté colonne et orienté ligne
Les bases de données orientées colonnes sont celles qui stockent les tables de données sous forme de sections de colonnes de données plutôt que de lignes de données. Bientôt, ils auront des familles de colonnes.
Base de données orientée lignes | Base de données orientée colonnes |
---|---|
Il convient au processus de transaction en ligne (OLTP). | Il convient au traitement analytique en ligne (OLAP). |
Ces bases de données sont conçues pour un petit nombre de lignes et de colonnes. | Les bases de données orientées colonnes sont conçues pour les tables volumineuses. |
L'image suivante montre les familles de colonnes dans une base de données orientée colonnes:
HBase et SGBDR
HBase | SGBDR |
---|---|
HBase est sans schéma, il n'a pas le concept de schéma de colonnes fixes; définit uniquement les familles de colonnes. | Un SGBDR est régi par son schéma, qui décrit toute la structure des tables. |
Il est conçu pour les grandes tables. HBase est évolutif horizontalement. | Il est fin et conçu pour les petites tables. Difficile à mettre à l'échelle. |
Aucune transaction n'est présente dans HBase. | Le SGBDR est transactionnel. |
Il a des données dé-normalisées. | Il aura des données normalisées. |
C'est bon pour les données semi-structurées et structurées. | C'est bon pour les données structurées. |
Caractéristiques de HBase
- HBase est linéairement évolutif.
- Il a un support de panne automatique.
- Il fournit une lecture et une écriture cohérentes.
- Il s'intègre à Hadoop, à la fois comme source et comme destination.
- Il a une API Java facile pour le client.
- Il fournit la réplication des données entre les clusters.
Où utiliser HBase
Apache HBase est utilisé pour avoir un accès aléatoire en lecture / écriture en temps réel au Big Data.
Il héberge de très grandes tables au-dessus de grappes de matériel de base.
Apache HBase est une base de données non relationnelle calquée sur la Bigtable de Google. Bigtable fonctionne sur Google File System, de même qu'Apache HBase fonctionne sur Hadoop et HDFS.
Applications de HBase
- Il est utilisé chaque fois qu'il est nécessaire d'écrire des applications lourdes.
- HBase est utilisé chaque fois que nous avons besoin de fournir un accès aléatoire rapide aux données disponibles.
- Des entreprises telles que Facebook, Twitter, Yahoo et Adobe utilisent HBase en interne.
Histoire HBase
An | un événement |
---|---|
Novembre 2006 | Google a publié le document sur BigTable. |
Février 2007 | Le prototype initial de HBase a été créé en tant que contribution Hadoop. |
Octobre 2007 | Le premier HBase utilisable avec Hadoop 0.15.0 a été publié. |
Janv.2008 | HBase est devenu le sous-projet de Hadoop. |
Octobre 2008 | HBase 0.18.1 a été libéré. |
Janv.2009 | HBase 0.19.0 a été publié. |
Septembre 2009 | HBase 0.20.0 a été publié. |
Mai 2010 | HBase est devenu le projet de premier niveau Apache. |
Dans HBase, les tables sont divisées en régions et sont servies par les serveurs de région. Les régions sont divisées verticalement par familles de colonnes en «Magasins». Les magasins sont enregistrés sous forme de fichiers dans HDFS. L'architecture de HBase est illustrée ci-dessous.
Note: Le terme «magasin» est utilisé pour les régions pour expliquer la structure de stockage.
HBase comprend trois composants principaux: la bibliothèque cliente, un serveur maître et des serveurs de région. Les serveurs de région peuvent être ajoutés ou supprimés selon les besoins.
MasterServer
Le serveur maître -
Attribue des régions aux serveurs de région et utilise l'aide d'Apache ZooKeeper pour cette tâche.
Gère l'équilibrage de charge des régions sur les serveurs de région. Il décharge les serveurs occupés et déplace les régions vers des serveurs moins occupés.
Maintient l'état du cluster en négociant l'équilibrage de charge.
Est responsable des modifications de schéma et d'autres opérations de métadonnées telles que la création de tables et de familles de colonnes.
Régions
Les régions ne sont rien d'autre que des tables qui sont divisées et réparties sur les serveurs de région.
Serveur de région
Les serveurs de région ont des régions qui -
- Communiquez avec le client et gérez les opérations liées aux données.
- Gérez les demandes de lecture et d'écriture pour toutes les régions en dessous.
- Décidez de la taille de la région en suivant les seuils de taille de la région.
Lorsque nous examinons plus en détail le serveur de région, il contient des régions et des magasins comme indiqué ci-dessous:
Le magasin contient le magasin de mémoire et les fichiers HFiles. Memstore est comme une mémoire cache. Tout ce qui est entré dans la HBase est initialement stocké ici. Plus tard, les données sont transférées et enregistrées dans Hfiles sous forme de blocs et le memstore est vidé.
Gardien de zoo
Zookeeper est un projet open-source qui fournit des services tels que la maintenance des informations de configuration, l'attribution de noms, la synchronisation distribuée, etc.
Zookeeper a des nœuds éphémères représentant différents serveurs de région. Les serveurs maîtres utilisent ces nœuds pour découvrir les serveurs disponibles.
Outre la disponibilité, les nœuds sont également utilisés pour suivre les pannes de serveur ou les partitions réseau.
Les clients communiquent avec les serveurs de la région via le gardien de zoo.
Dans les modes pseudo et autonome, HBase lui-même s'occupera du gardien de zoo.
Ce chapitre explique comment HBase est installé et configuré initialement. Java et Hadoop sont nécessaires pour continuer avec HBase, vous devez donc télécharger et installer java et Hadoop sur votre système.
Configuration avant l'installation
Avant d'installer Hadoop dans un environnement Linux, nous devons configurer Linux en utilisant ssh(Enveloppe de protection). Suivez les étapes ci-dessous pour configurer l'environnement Linux.
Créer un utilisateur
Tout d'abord, il est recommandé de créer un utilisateur distinct pour Hadoop afin d'isoler le système de fichiers Hadoop du système de fichiers Unix. Suivez les étapes ci-dessous pour créer un utilisateur.
- Ouvrez la racine en utilisant la commande «su».
- Créez un utilisateur à partir du compte root en utilisant la commande «useradd username».
- Vous pouvez maintenant ouvrir un compte utilisateur existant en utilisant la commande «su username».
Ouvrez le terminal Linux et tapez les commandes suivantes pour créer un utilisateur.
$ su
password:
# useradd hadoop
# passwd hadoop
New passwd:
Retype new passwd
Configuration SSH et génération de clé
La configuration SSH est requise pour effectuer différentes opérations sur le cluster, telles que les opérations de démarrage, d'arrêt et de shell du démon distribué. Pour authentifier différents utilisateurs de Hadoop, il est nécessaire de fournir une paire de clés publique / privée pour un utilisateur Hadoop et de la partager avec différents utilisateurs.
Les commandes suivantes sont utilisées pour générer une paire clé / valeur à l'aide de SSH. Copiez le formulaire de clés publiques id_rsa.pub dans allowed_keys et fournissez respectivement les autorisations de propriétaire, de lecture et d'écriture sur le fichier allowed_keys.
$ ssh-keygen -t rsa
$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys $ chmod 0600 ~/.ssh/authorized_keys
Vérifier ssh
ssh localhost
Installer Java
Java est le prérequis principal pour Hadoop et HBase. Tout d'abord, vous devez vérifier l'existence de java dans votre système en utilisant «java -version». La syntaxe de la commande java version est donnée ci-dessous.
$ java -version
Si tout fonctionne correctement, il vous donnera la sortie suivante.
java version "1.7.0_71"
Java(TM) SE Runtime Environment (build 1.7.0_71-b13)
Java HotSpot(TM) Client VM (build 25.0-b02, mixed mode)
Si java n'est pas installé sur votre système, suivez les étapes ci-dessous pour installer java.
Étape 1
Téléchargez java (JDK <dernière version> - X64.tar.gz) en visitant le lien suivant Oracle Java .
ensuite jdk-7u71-linux-x64.tar.gz sera téléchargé dans votre système.
Étape 2
En général, vous trouverez le fichier java téléchargé dans le dossier Téléchargements. Vérifiez-le et extrayez lejdk-7u71-linux-x64.gz fichier à l'aide des commandes suivantes.
$ cd Downloads/
$ ls jdk-7u71-linux-x64.gz $ tar zxf jdk-7u71-linux-x64.gz
$ ls
jdk1.7.0_71 jdk-7u71-linux-x64.gz
Étape 3
Pour rendre java disponible à tous les utilisateurs, vous devez le déplacer vers l'emplacement «/ usr / local /». Ouvrez root et saisissez les commandes suivantes.
$ su
password:
# mv jdk1.7.0_71 /usr/local/
# exit
Étape 4
Pour la mise en place PATH et JAVA_HOME variables, ajoutez les commandes suivantes à ~/.bashrc fichier.
export JAVA_HOME=/usr/local/jdk1.7.0_71
export PATH= $PATH:$JAVA_HOME/bin
Appliquez maintenant toutes les modifications dans le système en cours d'exécution.
$ source ~/.bashrc
Étape 5
Utilisez les commandes suivantes pour configurer des alternatives Java:
# alternatives --install /usr/bin/java java usr/local/java/bin/java 2
# alternatives --install /usr/bin/javac javac usr/local/java/bin/javac 2
# alternatives --install /usr/bin/jar jar usr/local/java/bin/jar 2
# alternatives --set java usr/local/java/bin/java
# alternatives --set javac usr/local/java/bin/javac
# alternatives --set jar usr/local/java/bin/jar
Vérifiez maintenant le java -version commande depuis le terminal comme expliqué ci-dessus.
Téléchargement de Hadoop
Après avoir installé java, vous devez installer Hadoop. Tout d'abord, vérifiez l'existence de Hadoop à l'aide de la commande «Hadoop version» comme indiqué ci-dessous.
hadoop version
Si tout fonctionne correctement, il vous donnera la sortie suivante.
Hadoop 2.6.0
Compiled by jenkins on 2014-11-13T21:10Z
Compiled with protoc 2.5.0
From source with checksum 18e43357c8f927c0695f1e9522859d6a
This command was run using
/home/hadoop/hadoop/share/hadoop/common/hadoop-common-2.6.0.jar
Si votre système ne parvient pas à localiser Hadoop, téléchargez Hadoop dans votre système. Suivez les commandes ci-dessous pour ce faire.
Téléchargez et extrayez hadoop-2.6.0 depuis Apache Software Foundation en utilisant les commandes suivantes.
$ su
password:
# cd /usr/local
# wget http://mirrors.advancedhosters.com/apache/hadoop/common/hadoop-
2.6.0/hadoop-2.6.0-src.tar.gz
# tar xzf hadoop-2.6.0-src.tar.gz
# mv hadoop-2.6.0/* hadoop/
# exit
Installer Hadoop
Installez Hadoop dans l'un des modes requis. Ici, nous démontrons les fonctionnalités HBase en mode pseudo distribué, donc installons Hadoop en mode pseudo distribué.
Les étapes suivantes sont utilisées pour l'installation Hadoop 2.4.1.
Étape 1 - Configuration de Hadoop
Vous pouvez définir des variables d'environnement Hadoop en ajoutant les commandes suivantes à ~/.bashrc fichier.
export HADOOP_HOME=/usr/local/hadoop
export HADOOP_MAPRED_HOME=$HADOOP_HOME export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME export YARN_HOME=$HADOOP_HOME
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin
export HADOOP_INSTALL=$HADOOP_HOME
Appliquez maintenant toutes les modifications dans le système en cours d'exécution.
$ source ~/.bashrc
Étape 2 - Configuration Hadoop
Vous pouvez trouver tous les fichiers de configuration Hadoop à l'emplacement «$ HADOOP_HOME / etc / hadoop». Vous devez apporter des modifications à ces fichiers de configuration en fonction de votre infrastructure Hadoop.
$ cd $HADOOP_HOME/etc/hadoop
Afin de développer des programmes Hadoop en java, vous devez réinitialiser la variable d'environnement java dans hadoop-env.sh fichier en remplaçant JAVA_HOME value avec l'emplacement de java dans votre système.
export JAVA_HOME=/usr/local/jdk1.7.0_71
Vous devrez éditer les fichiers suivants pour configurer Hadoop.
core-site.xml
le core-site.xml Le fichier contient des informations telles que le numéro de port utilisé pour l'instance Hadoop, la mémoire allouée au système de fichiers, la limite de mémoire pour le stockage des données et la taille des tampons de lecture / écriture.
Ouvrez core-site.xml et ajoutez les propriétés suivantes entre les balises <configuration> et </configuration>.
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
hdfs-site.xml
le hdfs-site.xml fichier contient des informations telles que la valeur des données de réplication, le chemin du namenode et le chemin du datanode de vos systèmes de fichiers locaux, où vous souhaitez stocker l'infrastructure Hadoop.
Supposons les données suivantes.
dfs.replication (data replication value) = 1
(In the below given path /hadoop/ is the user name.
hadoopinfra/hdfs/namenode is the directory created by hdfs file system.)
namenode path = //home/hadoop/hadoopinfra/hdfs/namenode
(hadoopinfra/hdfs/datanode is the directory created by hdfs file system.)
datanode path = //home/hadoop/hadoopinfra/hdfs/datanode
Ouvrez ce fichier et ajoutez les propriétés suivantes entre les balises <configuration>, </configuration>.
<configuration>
<property>
<name>dfs.replication</name >
<value>1</value>
</property>
<property>
<name>dfs.name.dir</name>
<value>file:///home/hadoop/hadoopinfra/hdfs/namenode</value>
</property>
<property>
<name>dfs.data.dir</name>
<value>file:///home/hadoop/hadoopinfra/hdfs/datanode</value>
</property>
</configuration>
Note: Dans le fichier ci-dessus, toutes les valeurs de propriété sont définies par l'utilisateur et vous pouvez apporter des modifications en fonction de votre infrastructure Hadoop.
yarn-site.xml
Ce fichier est utilisé pour configurer le fil dans Hadoop. Ouvrez le fichier yarn-site.xml et ajoutez la propriété suivante entre les <configuration $ gt ;, </ configuration $ gt; balises dans ce fichier.
<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>
mapred-site.xml
Ce fichier est utilisé pour spécifier le framework MapReduce que nous utilisons. Par défaut, Hadoop contient un modèle de yarn-site.xml. Tout d'abord, il est nécessaire de copier le fichier à partir demapred-site.xml.template à mapred-site.xml fichier à l'aide de la commande suivante.
$ cp mapred-site.xml.template mapred-site.xml
Ouvert mapred-site.xml et ajoutez les propriétés suivantes entre les balises <configuration> et </configuration>.
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
Vérification de l'installation de Hadoop
Les étapes suivantes permettent de vérifier l'installation de Hadoop.
Étape 1 - Configuration du nœud de nom
Configurez le namenode en utilisant la commande «hdfs namenode -format» comme suit.
$ cd ~ $ hdfs namenode -format
Le résultat attendu est le suivant.
10/24/14 21:30:55 INFO namenode.NameNode: STARTUP_MSG:
/************************************************************
STARTUP_MSG: Starting NameNode
STARTUP_MSG: host = localhost/192.168.1.11
STARTUP_MSG: args = [-format]
STARTUP_MSG: version = 2.4.1
...
...
10/24/14 21:30:56 INFO common.Storage: Storage directory
/home/hadoop/hadoopinfra/hdfs/namenode has been successfully formatted.
10/24/14 21:30:56 INFO namenode.NNStorageRetentionManager: Going to
retain 1 images with txid >= 0
10/24/14 21:30:56 INFO util.ExitUtil: Exiting with status 0
10/24/14 21:30:56 INFO namenode.NameNode: SHUTDOWN_MSG:
/************************************************************
SHUTDOWN_MSG: Shutting down NameNode at localhost/192.168.1.11
************************************************************/
Étape 2 - Vérification des fichiers DFS Hadoop
La commande suivante est utilisée pour démarrer dfs. L'exécution de cette commande démarrera votre système de fichiers Hadoop.
$ start-dfs.sh
Le résultat attendu est le suivant.
10/24/14 21:37:56
Starting namenodes on [localhost]
localhost: starting namenode, logging to /home/hadoop/hadoop-
2.4.1/logs/hadoop-hadoop-namenode-localhost.out
localhost: starting datanode, logging to /home/hadoop/hadoop-
2.4.1/logs/hadoop-hadoop-datanode-localhost.out
Starting secondary namenodes [0.0.0.0]
Étape 3 - Vérification du script de fil
La commande suivante est utilisée pour démarrer le script de fil. L'exécution de cette commande démarrera vos démons yarn.
$ start-yarn.sh
Le résultat attendu est le suivant.
starting yarn daemons
starting resourcemanager, logging to /home/hadoop/hadoop-
2.4.1/logs/yarn-hadoop-resourcemanager-localhost.out
localhost: starting nodemanager, logging to /home/hadoop/hadoop-
2.4.1/logs/yarn-hadoop-nodemanager-localhost.out
Étape 4 - Accéder à Hadoop sur le navigateur
Le numéro de port par défaut pour accéder à Hadoop est 50070. Utilisez l'url suivante pour obtenir les services Hadoop sur votre navigateur.
http://localhost:50070
Étape 5 - Vérifiez toutes les applications du cluster
Le numéro de port par défaut pour accéder à toutes les applications du cluster est 8088. Utilisez l'url suivante pour visiter ce service.
http://localhost:8088/
Installation de HBase
Nous pouvons installer HBase dans l'un des trois modes: mode autonome, mode pseudo-distribué et mode entièrement distribué.
Installation de HBase en mode autonome
Téléchargez la dernière version stable du formulaire HBase http://www.interior-dsgn.com/apache/hbase/stable/à l'aide de la commande «wget» et extrayez-la à l'aide de la commande tar «zxvf». Voir la commande suivante.
$cd usr/local/ $wget http://www.interior-dsgn.com/apache/hbase/stable/hbase-0.98.8-
hadoop2-bin.tar.gz
$tar -zxvf hbase-0.98.8-hadoop2-bin.tar.gz
Passez en mode super utilisateur et déplacez le dossier HBase vers / usr / local comme indiqué ci-dessous.
$su
$password: enter your password here
mv hbase-0.99.1/* Hbase/
Configuration de HBase en mode autonome
Avant de continuer avec HBase, vous devez éditer les fichiers suivants et configurer HBase.
hbase-env.sh
Définissez java Home pour HBase et ouvrez hbase-env.shfichier du dossier conf. Modifiez la variable d'environnement JAVA_HOME et modifiez le chemin existant vers votre variable JAVA_HOME actuelle comme indiqué ci-dessous.
cd /usr/local/Hbase/conf
gedit hbase-env.sh
Cela ouvrira le fichier env.sh de HBase. Maintenant, remplacez l'existantJAVA_HOME valeur avec votre valeur actuelle comme indiqué ci-dessous.
export JAVA_HOME=/usr/lib/jvm/java-1.7.0
hbase-site.xml
Il s'agit du fichier de configuration principal de HBase. Définissez le répertoire de données à un emplacement approprié en ouvrant le dossier de base HBase dans / usr / local / HBase. Dans le dossier conf, vous trouverez plusieurs fichiers, ouvrez lehbase-site.xml fichier comme indiqué ci-dessous.
#cd /usr/local/HBase/
#cd conf
# gedit hbase-site.xml
À l'intérieur de hbase-site.xmlfichier, vous trouverez les balises <configuration> et </configuration>. Dans ceux-ci, définissez le répertoire HBase sous la clé de propriété avec le nom «hbase.rootdir» comme indiqué ci-dessous.
<configuration>
//Here you have to set the path where you want HBase to store its files.
<property>
<name>hbase.rootdir</name>
<value>file:/home/hadoop/HBase/HFiles</value>
</property>
//Here you have to set the path where you want HBase to store its built in zookeeper files.
<property>
<name>hbase.zookeeper.property.dataDir</name>
<value>/home/hadoop/zookeeper</value>
</property>
</configuration>
Avec cela, la partie d'installation et de configuration de HBase est terminée avec succès. Nous pouvons démarrer HBase en utilisantstart-hbase.shscript fourni dans le dossier bin de HBase. Pour cela, ouvrez le dossier d'accueil HBase et exécutez le script de démarrage HBase comme indiqué ci-dessous.
$cd /usr/local/HBase/bin
$./start-hbase.sh
Si tout se passe bien, lorsque vous essayez d'exécuter le script de démarrage HBase, un message s'affiche indiquant que HBase a démarré.
starting master, logging to /usr/local/HBase/bin/../logs/hbase-tpmaster-localhost.localdomain.out
Installation de HBase en mode pseudo-distribué
Voyons maintenant comment HBase est installé en mode pseudo-distribué.
Configurer HBase
Avant de continuer avec HBase, configurez Hadoop et HDFS sur votre système local ou sur un système distant et assurez-vous qu'ils fonctionnent. Arrêtez HBase s'il est en cours d'exécution.
hbase-site.xml
Modifiez le fichier hbase-site.xml pour ajouter les propriétés suivantes.
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
Il mentionnera dans quel mode HBase doit être exécuté. Dans le même fichier du système de fichiers local, modifiez le hbase.rootdir, l'adresse de votre instance HDFS, à l'aide de la syntaxe URI hdfs: ////. Nous exécutons HDFS sur l'hôte local au port 8030.
<property>
<name>hbase.rootdir</name>
<value>hdfs://localhost:8030/hbase</value>
</property>
Démarrer HBase
Une fois la configuration terminée, accédez au dossier d'accueil HBase et démarrez HBase à l'aide de la commande suivante.
$cd /usr/local/HBase
$bin/start-hbase.sh
Note: Avant de démarrer HBase, assurez-vous que Hadoop est en cours d'exécution.
Vérification du répertoire HBase dans HDFS
HBase crée son répertoire dans HDFS. Pour voir le répertoire créé, accédez à Hadoop bin et tapez la commande suivante.
$ ./bin/hadoop fs -ls /hbase
Si tout se passe bien, il vous donnera la sortie suivante.
Found 7 items
drwxr-xr-x - hbase users 0 2014-06-25 18:58 /hbase/.tmp
drwxr-xr-x - hbase users 0 2014-06-25 21:49 /hbase/WALs
drwxr-xr-x - hbase users 0 2014-06-25 18:48 /hbase/corrupt
drwxr-xr-x - hbase users 0 2014-06-25 18:58 /hbase/data
-rw-r--r-- 3 hbase users 42 2014-06-25 18:41 /hbase/hbase.id
-rw-r--r-- 3 hbase users 7 2014-06-25 18:41 /hbase/hbase.version
drwxr-xr-x - hbase users 0 2014-06-25 21:49 /hbase/oldWALs
Démarrer et arrêter un maître
En utilisant «local-master-backup.sh», vous pouvez démarrer jusqu'à 10 serveurs. Ouvrez le dossier de base de HBase, master et exécutez la commande suivante pour le démarrer.
$ ./bin/local-master-backup.sh 2 4
Pour tuer un maître de sauvegarde, vous avez besoin de son identifiant de processus, qui sera stocké dans un fichier nommé “/tmp/hbase-USER-X-master.pid.” vous pouvez tuer le maître de sauvegarde à l'aide de la commande suivante.
$ cat /tmp/hbase-user-1-master.pid |xargs kill -9
Démarrage et arrêt des RegionServers
Vous pouvez exécuter plusieurs serveurs de région à partir d'un seul système à l'aide de la commande suivante.
$ .bin/local-regionservers.sh start 2 3
Pour arrêter un serveur de région, utilisez la commande suivante.
$ .bin/local-regionservers.sh stop 3
Démarrage de HBaseShell
Après avoir installé HBase avec succès, vous pouvez démarrer HBase Shell. Vous trouverez ci-dessous la séquence des étapes à suivre pour démarrer le shell HBase. Ouvrez le terminal et connectez-vous en tant que super utilisateur.
Démarrez le système de fichiers Hadoop
Parcourez le dossier sbin de la maison Hadoop et démarrez le système de fichiers Hadoop comme indiqué ci-dessous.
$cd $HADOOP_HOME/sbin
$start-all.sh
Démarrez HBase
Parcourez le dossier bin du répertoire racine HBase et démarrez HBase.
$cd /usr/local/HBase
$./bin/start-hbase.sh
Démarrez HBase Master Server
Ce sera le même répertoire. Démarrez-le comme indiqué ci-dessous.
$./bin/local-master-backup.sh start 2 (number signifies specific
server.)
Région de départ
Démarrez le serveur de région comme indiqué ci-dessous.
$./bin/./local-regionservers.sh start 3
Démarrez HBase Shell
Vous pouvez démarrer le shell HBase à l'aide de la commande suivante.
$cd bin
$./hbase shell
Cela vous donnera l'invite HBase Shell comme indiqué ci-dessous.
2014-12-09 14:24:27,526 INFO [main] Configuration.deprecation:
hadoop.native.lib is deprecated. Instead, use io.native.lib.available
HBase Shell; enter 'help<RETURN>' for list of supported commands.
Type "exit<RETURN>" to leave the HBase Shell
Version 0.98.8-hadoop2, r6cfc8d064754251365e070a10a82eb169956d5fe, Fri
Nov 14 18:26:29 PST 2014
hbase(main):001:0>
Interface Web HBase
Pour accéder à l'interface Web de HBase, saisissez l'url suivante dans le navigateur.
http://localhost:60010
Cette interface répertorie vos serveurs de région, vos maîtres de sauvegarde et vos tables HBase en cours d'exécution.
Serveurs de la région HBase et maîtres de sauvegarde
Tables HBase
Définition de l'environnement Java
Nous pouvons également communiquer avec HBase à l'aide de bibliothèques Java, mais avant d'accéder à HBase à l'aide de l'API Java, vous devez définir le chemin de classe pour ces bibliothèques.
Définition du chemin de classe
Avant de procéder à la programmation, définissez le chemin de classe sur les bibliothèques HBase dans .bashrcfichier. Ouvert.bashrc dans l'un des éditeurs comme indiqué ci-dessous.
$ gedit ~/.bashrc
Définissez le chemin de classe pour les bibliothèques HBase (dossier lib dans HBase) comme indiqué ci-dessous.
export CLASSPATH = $CLASSPATH://home/hadoop/hbase/lib/*
Cela permet d'éviter l'exception «classe non trouvée» lors de l'accès à HBase à l'aide de l'API java.
Ce chapitre explique comment démarrer le shell interactif HBase fourni avec HBase.
Shell HBase
HBase contient un shell à l'aide duquel vous pouvez communiquer avec HBase. HBase utilise le système de fichiers Hadoop pour stocker ses données. Il aura un serveur maître et des serveurs de région. Le stockage des données se fera sous forme de régions (tableaux). Ces régions seront divisées et stockées dans des serveurs de région.
Le serveur maître gère ces serveurs de région et toutes ces tâches ont lieu sur HDFS. Vous trouverez ci-dessous certaines des commandes prises en charge par HBase Shell.
Commandes générales
status - Fournit l'état de HBase, par exemple, le nombre de serveurs.
version - Fournit la version de HBase utilisée.
table_help - Fournit une aide pour les commandes de référence de table.
whoami - Fournit des informations sur l'utilisateur.
Langage de définition des données
Ce sont les commandes qui fonctionnent sur les tables dans HBase.
create - Crée une table.
list - Répertorie toutes les tables dans HBase.
disable - Désactive une table.
is_disabled - Vérifie si une table est désactivée.
enable - Active une table.
is_enabled - Vérifie si une table est activée.
describe - Fournit la description d'une table.
alter - Modifie une table.
exists - Vérifie si une table existe.
drop - Supprime une table de HBase.
drop_all - Supprime les tables correspondant au 'regex' donné dans la commande.
Java Admin API- Avant toutes les commandes ci-dessus, Java fournit une API d'administration pour atteindre les fonctionnalités DDL grâce à la programmation. En dessous deorg.apache.hadoop.hbase.client package, HBaseAdmin et HTableDescriptor sont les deux classes importantes de ce package qui fournissent des fonctionnalités DDL.
Langage de manipulation des données
put - Place une valeur de cellule dans une colonne spécifiée dans une ligne spécifiée dans une table particulière.
get - Récupère le contenu d'une ligne ou d'une cellule.
delete - Supprime une valeur de cellule dans un tableau.
deleteall - Supprime toutes les cellules d'une ligne donnée.
scan - Analyse et renvoie les données de la table.
count - Compte et renvoie le nombre de lignes dans une table.
truncate - Désactive, supprime et recrée une table spécifiée.
Java client API - Avant toutes les commandes ci-dessus, Java fournit une API client pour réaliser les fonctionnalités DML, CRUD (Create Retrieve Update Delete) et plus encore via la programmation, sous le package org.apache.hadoop.hbase.client. HTable Put et Get sont les classes importantes de ce package.
Démarrage de HBase Shell
Pour accéder au shell HBase, vous devez accéder au dossier d'accueil HBase.
cd /usr/localhost/
cd Hbase
Vous pouvez démarrer le shell interactif HBase en utilisant “hbase shell” comme indiqué ci-dessous.
./bin/hbase shell
Si vous avez correctement installé HBase sur votre système, il vous donne l'invite du shell HBase comme indiqué ci-dessous.
HBase Shell; enter 'help<RETURN>' for list of supported commands.
Type "exit<RETURN>" to leave the HBase Shell
Version 0.94.23, rf42302b28aceaab773b15f234aa8718fff7eea3c, Wed Aug 27
00:54:09 UTC 2014
hbase(main):001:0>
Pour quitter la commande shell interactive à tout moment, tapez exit ou utilisez <ctrl + c>. Vérifiez le fonctionnement du shell avant de continuer. Utilisez lelist commande à cet effet. Listest une commande utilisée pour obtenir la liste de toutes les tables dans HBase. Tout d'abord, vérifiez l'installation et la configuration de HBase dans votre système à l'aide de cette commande comme indiqué ci-dessous.
hbase(main):001:0> list
Lorsque vous tapez cette commande, elle vous donne la sortie suivante.
hbase(main):001:0> list
TABLE
Les commandes générales dans HBase sont status, version, table_help et whoami. Ce chapitre explique ces commandes.
statut
Cette commande renvoie l'état du système, y compris les détails des serveurs exécutés sur le système. Sa syntaxe est la suivante:
hbase(main):009:0> status
Si vous exécutez cette commande, elle renvoie la sortie suivante.
hbase(main):009:0> status
3 servers, 0 dead, 1.3333 average load
version
Cette commande renvoie la version de HBase utilisée dans votre système. Sa syntaxe est la suivante:
hbase(main):010:0> version
Si vous exécutez cette commande, elle renvoie la sortie suivante.
hbase(main):009:0> version
0.98.8-hadoop2, r6cfc8d064754251365e070a10a82eb169956d5fe, Fri Nov 14
18:26:29 PST 2014
table_help
Cette commande vous explique quoi et comment utiliser les commandes référencées par table. Vous trouverez ci-dessous la syntaxe pour utiliser cette commande.
hbase(main):02:0> table_help
Lorsque vous utilisez cette commande, elle affiche des rubriques d'aide pour les commandes liées aux tables. Ci-dessous, la sortie partielle de cette commande.
hbase(main):002:0> table_help
Help for table-reference commands.
You can either create a table via 'create' and then manipulate the table
via commands like 'put', 'get', etc.
See the standard help information for how to use each of these commands.
However, as of 0.96, you can also get a reference to a table, on which
you can invoke commands.
For instance, you can get create a table and keep around a reference to
it via:
hbase> t = create 't', 'cf'…...
qui suis je
Cette commande renvoie les détails utilisateur de HBase. Si vous exécutez cette commande, renvoie l'utilisateur HBase actuel comme indiqué ci-dessous.
hbase(main):008:0> whoami
hadoop (auth:SIMPLE)
groups: hadoop
HBase est écrit en java, donc il fournit une API java pour communiquer avec HBase. L'API Java est le moyen le plus rapide de communiquer avec HBase. Ci-dessous se trouve l'API Java Admin référencée qui couvre les tâches utilisées pour gérer les tables.
Classe HBaseAdmin
HBaseAdminest une classe représentant l'Admin. Cette classe appartient à laorg.apache.hadoop.hbase.clientpaquet. En utilisant cette classe, vous pouvez effectuer les tâches d'un administrateur. Vous pouvez obtenir l'instance de l'administrateur en utilisantConnection.getAdmin() méthode.
Méthodes et description
S.No. | Méthodes et description |
---|---|
1 | void createTable(HTableDescriptor desc) Crée une nouvelle table. |
2 | void createTable(HTableDescriptor desc, byte[][] splitKeys) Crée une nouvelle table avec un ensemble initial de régions vides définies par les clés de fractionnement spécifiées. |
3 | void deleteColumn(byte[] tableName, String columnName) Supprime une colonne d'une table. |
4 | void deleteColumn(String tableName, String columnName) Supprimer une colonne d'une table. |
5 | void deleteTable(String tableName) Supprime une table. |
Descripteur de classe
Cette classe contient les détails d'une table HBase tels que:
- les descripteurs de toutes les familles de colonnes,
- si la table est une table de catalogue,
- si la table est en lecture seule,
- la taille maximale du magasin de souvenirs,
- quand la division de la région doit se produire,
- co-processeurs qui lui sont associés, etc.
Constructeurs
S.No. | Constructeur et résumé |
---|---|
1 | HTableDescriptor(TableName name) Construit un descripteur de table spécifiant un objet TableName. |
Méthodes et description
S.No. | Méthodes et description |
---|---|
1 | HTableDescriptor addFamily(HColumnDescriptor family) Ajoute une famille de colonnes au descripteur donné |
Création d'une table à l'aide de HBase Shell
Vous pouvez créer une table à l'aide du createcommande, ici vous devez spécifier le nom de la table et le nom de la famille de colonnes. lesyntax pour créer une table dans le shell HBase est illustré ci-dessous.
create ‘<table name>’,’<column family>’
Exemple
Vous trouverez ci-dessous un exemple de schéma d'une table nommée emp. Il comporte deux familles de colonnes: «données personnelles» et «données professionnelles».
Touche de ligne | données personnelles | données professionnelles |
---|---|---|
Vous pouvez créer cette table dans le shell HBase comme indiqué ci-dessous.
hbase(main):002:0> create 'emp', 'personal data', 'professional data'
Et cela vous donnera la sortie suivante.
0 row(s) in 1.1300 seconds
=> Hbase::Table - emp
Vérification
Vous pouvez vérifier si la table est créée à l'aide du listcomme indiqué ci-dessous. Ici vous pouvez observer la table emp créée.
hbase(main):002:0> list
TABLE
emp
2 row(s) in 0.0340 seconds
Création d'une table à l'aide de l'API Java
Vous pouvez créer une table dans HBase en utilisant le createTable() méthode de HBaseAdminclasse. Cette classe appartient à laorg.apache.hadoop.hbase.clientpaquet. Vous trouverez ci-dessous les étapes pour créer une table dans HBase à l'aide de l'API java.
Étape 1: instancier HBaseAdmin
Cette classe requiert l'objet Configuration en tant que paramètre, instanciez donc initialement la classe Configuration et transmettez cette instance à HBaseAdmin.
Configuration conf = HBaseConfiguration.create();
HBaseAdmin admin = new HBaseAdmin(conf);
Étape 2: créer un descripteur de table
HTableDescriptor est une classe qui appartient au org.apache.hadoop.hbaseclasse. Cette classe est comme un conteneur de noms de tables et de familles de colonnes.
//creating table descriptor
HTableDescriptor table = new HTableDescriptor(toBytes("Table name"));
//creating column family descriptor
HColumnDescriptor family = new HColumnDescriptor(toBytes("column family"));
//adding coloumn family to HTable
table.addFamily(family);
Étape 3: Exécuter via l'administrateur
En utilisant le createTable() méthode de HBaseAdmin class, vous pouvez exécuter la table créée en mode Admin.
admin.createTable(table);
Vous trouverez ci-dessous le programme complet pour créer une table via admin.
import java.io.IOException;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.HColumnDescriptor;
import org.apache.hadoop.hbase.HTableDescriptor;
import org.apache.hadoop.hbase.client.HBaseAdmin;
import org.apache.hadoop.hbase.TableName;
import org.apache.hadoop.conf.Configuration;
public class CreateTable {
public static void main(String[] args) throws IOException {
// Instantiating configuration class
Configuration con = HBaseConfiguration.create();
// Instantiating HbaseAdmin class
HBaseAdmin admin = new HBaseAdmin(con);
// Instantiating table descriptor class
HTableDescriptor tableDescriptor = new
HTableDescriptor(TableName.valueOf("emp"));
// Adding column families to table descriptor
tableDescriptor.addFamily(new HColumnDescriptor("personal"));
tableDescriptor.addFamily(new HColumnDescriptor("professional"));
// Execute the table through admin
admin.createTable(tableDescriptor);
System.out.println(" Table created ");
}
}
Compilez et exécutez le programme ci-dessus comme indiqué ci-dessous.
$javac CreateTable.java
$java CreateTable
Ce qui suit devrait être la sortie:
Table created
Lister une table à l'aide de HBase Shell
list est la commande utilisée pour lister toutes les tables dans HBase. La syntaxe de la commande list est donnée ci-dessous.
hbase(main):001:0 > list
Lorsque vous tapez cette commande et que vous l'exécutez dans l'invite HBase, la liste de toutes les tables dans HBase s'affiche comme indiqué ci-dessous.
hbase(main):001:0> list
TABLE
emp
Ici vous pouvez observer une table nommée emp.
Liste des tables à l'aide de l'API Java
Suivez les étapes ci-dessous pour obtenir la liste des tables de HBase à l'aide de l'API java.
Étape 1
Vous avez une méthode appelée listTables() dans la classe HBaseAdminpour obtenir la liste de toutes les tables dans HBase. Cette méthode renvoie un tableau deHTableDescriptor objets.
//creating a configuration object
Configuration conf = HBaseConfiguration.create();
//Creating HBaseAdmin object
HBaseAdmin admin = new HBaseAdmin(conf);
//Getting all the list of tables using HBaseAdmin object
HTableDescriptor[] tableDescriptor = admin.listTables();
Étape 2
Vous pouvez obtenir la longueur du HTableDescriptor[] tableau utilisant la variable de longueur du HTableDescriptorclasse. Obtenez le nom des tables de cet objet en utilisantgetNameAsString()méthode. Exécutez la boucle 'for' en utilisant ces derniers et obtenez la liste des tables dans HBase.
Ci-dessous, le programme permettant de répertorier toutes les tables dans HBase à l'aide de l'API Java.
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.HTableDescriptor;
import org.apache.hadoop.hbase.MasterNotRunningException;
import org.apache.hadoop.hbase.client.HBaseAdmin;
public class ListTables {
public static void main(String args[])throws MasterNotRunningException, IOException{
// Instantiating a configuration class
Configuration conf = HBaseConfiguration.create();
// Instantiating HBaseAdmin class
HBaseAdmin admin = new HBaseAdmin(conf);
// Getting all the list of tables using HBaseAdmin object
HTableDescriptor[] tableDescriptor = admin.listTables();
// printing all the table names.
for (int i=0; i<tableDescriptor.length;i++ ){
System.out.println(tableDescriptor[i].getNameAsString());
}
}
}
Compilez et exécutez le programme ci-dessus comme indiqué ci-dessous.
$javac ListTables.java
$java ListTables
Ce qui suit devrait être la sortie:
User
emp
Désactivation d'une table à l'aide de HBase Shell
Pour supprimer une table ou modifier ses paramètres, vous devez d'abord désactiver la table à l'aide de la commande disable. Vous pouvez le réactiver à l'aide de la commande enable.
Voici la syntaxe pour désactiver une table:
disable ‘emp’
Exemple
Ci-dessous est un exemple qui montre comment désactiver une table.
hbase(main):025:0> disable 'emp'
0 row(s) in 1.2760 seconds
Vérification
Après avoir désactivé la table, vous pouvez toujours sentir son existence grâce à list et existscommandes. Vous ne pouvez pas le scanner. Cela vous donnera l'erreur suivante.
hbase(main):028:0> scan 'emp'
ROW COLUMN + CELL
ERROR: emp is disabled.
is_disabled
Cette commande permet de savoir si une table est désactivée. Sa syntaxe est la suivante.
hbase> is_disabled 'table name'
L'exemple suivant vérifie si la table nommée emp est désactivée. S'il est désactivé, il retournera true et sinon, il retournera false.
hbase(main):031:0> is_disabled 'emp'
true
0 row(s) in 0.0440 seconds
désactiver tous les
Cette commande est utilisée pour désactiver toutes les tables correspondant à l'expression régulière donnée. La syntaxe dedisable_all La commande est donnée ci-dessous.
hbase> disable_all 'r.*'
Supposons qu'il y ait 5 tables dans HBase, à savoir raja, rajani, rajendra, rajesh et raju. Le code suivant désactivera toutes les tables commençant parraj.
hbase(main):002:07> disable_all 'raj.*'
raja
rajani
rajendra
rajesh
raju
Disable the above 5 tables (y/n)?
y
5 tables successfully disabled
Désactiver une table à l'aide de l'API Java
Pour vérifier si une table est désactivée, isTableDisabled() méthode est utilisée et pour désactiver une table, disableTable()méthode est utilisée. Ces méthodes appartiennent à laHBaseAdminclasse. Suivez les étapes ci-dessous pour désactiver un tableau.
Étape 1
Instancier HBaseAdmin classe comme indiqué ci-dessous.
// Creating configuration object
Configuration conf = HBaseConfiguration.create();
// Creating HBaseAdmin object
HBaseAdmin admin = new HBaseAdmin(conf);
Étape 2
Vérifiez si la table est désactivée à l'aide de isTableDisabled() méthode comme indiqué ci-dessous.
Boolean b = admin.isTableDisabled("emp");
Étape 3
Si le tableau n'est pas désactivé, désactivez-le comme indiqué ci-dessous.
if(!b){
admin.disableTable("emp");
System.out.println("Table disabled");
}
Ci-dessous est le programme complet pour vérifier si la table est désactivée; sinon, comment le désactiver.
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.MasterNotRunningException;
import org.apache.hadoop.hbase.client.HBaseAdmin;
public class DisableTable{
public static void main(String args[]) throws MasterNotRunningException, IOException{
// Instantiating configuration class
Configuration conf = HBaseConfiguration.create();
// Instantiating HBaseAdmin class
HBaseAdmin admin = new HBaseAdmin(conf);
// Verifying weather the table is disabled
Boolean bool = admin.isTableDisabled("emp");
System.out.println(bool);
// Disabling the table using HBaseAdmin object
if(!bool){
admin.disableTable("emp");
System.out.println("Table disabled");
}
}
}
Compilez et exécutez le programme ci-dessus comme indiqué ci-dessous.
$javac DisableTable.java
$java DsiableTable
Ce qui suit devrait être la sortie:
false
Table disabled
Activation d'une table à l'aide de HBase Shell
Syntaxe pour activer une table:
enable ‘emp’
Exemple
Ci-dessous est un exemple pour activer une table.
hbase(main):005:0> enable 'emp'
0 row(s) in 0.4580 seconds
Vérification
Après avoir activé la table, scannez-la. Si vous pouvez voir le schéma, votre table est activée avec succès.
hbase(main):006:0> scan 'emp'
ROW COLUMN + CELL
1 column = personal data:city, timestamp = 1417516501, value = hyderabad
1 column = personal data:name, timestamp = 1417525058, value = ramu
1 column = professional data:designation, timestamp = 1417532601, value = manager
1 column = professional data:salary, timestamp = 1417524244109, value = 50000
2 column = personal data:city, timestamp = 1417524574905, value = chennai
2 column = personal data:name, timestamp = 1417524556125, value = ravi
2 column = professional data:designation, timestamp = 14175292204, value = sr:engg
2 column = professional data:salary, timestamp = 1417524604221, value = 30000
3 column = personal data:city, timestamp = 1417524681780, value = delhi
3 column = personal data:name, timestamp = 1417524672067, value = rajesh
3 column = professional data:designation, timestamp = 14175246987, value = jr:engg
3 column = professional data:salary, timestamp = 1417524702514, value = 25000
3 row(s) in 0.0400 seconds
est autorisé
Cette commande est utilisée pour savoir si une table est activée. Sa syntaxe est la suivante:
hbase> is_enabled 'table name'
Le code suivant vérifie si la table nommée empest autorisé. S'il est activé, il retournera true et sinon, il retournera false.
hbase(main):031:0> is_enabled 'emp'
true
0 row(s) in 0.0440 seconds
Activer une table à l'aide de l'API Java
Pour vérifier si une table est activée, isTableEnabled()la méthode est utilisée; et pour activer une table,enableTable()méthode est utilisée. Ces méthodes appartiennent àHBaseAdminclasse. Suivez les étapes ci-dessous pour activer un tableau.
Étape 1
Instancier HBaseAdmin classe comme indiqué ci-dessous.
// Creating configuration object
Configuration conf = HBaseConfiguration.create();
// Creating HBaseAdmin object
HBaseAdmin admin = new HBaseAdmin(conf);
Étape 2
Vérifiez si la table est activée à l'aide de isTableEnabled() méthode comme indiqué ci-dessous.
Boolean bool = admin.isTableEnabled("emp");
Étape 3
Si le tableau n'est pas désactivé, désactivez-le comme indiqué ci-dessous.
if(!bool){
admin.enableTable("emp");
System.out.println("Table enabled");
}
Vous trouverez ci-dessous le programme complet pour vérifier si la table est activée et si ce n'est pas le cas, comment l'activer.
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.MasterNotRunningException;
import org.apache.hadoop.hbase.client.HBaseAdmin;
public class EnableTable{
public static void main(String args[]) throws MasterNotRunningException, IOException{
// Instantiating configuration class
Configuration conf = HBaseConfiguration.create();
// Instantiating HBaseAdmin class
HBaseAdmin admin = new HBaseAdmin(conf);
// Verifying whether the table is disabled
Boolean bool = admin.isTableEnabled("emp");
System.out.println(bool);
// Enabling the table using HBaseAdmin object
if(!bool){
admin.enableTable("emp");
System.out.println("Table Enabled");
}
}
}
Compilez et exécutez le programme ci-dessus comme indiqué ci-dessous.
$javac EnableTable.java
$java EnableTable
Ce qui suit devrait être la sortie:
false
Table Enabled
décris
Cette commande renvoie la description de la table. Sa syntaxe est la suivante:
hbase> describe 'table name'
Ci-dessous, la sortie de la commande describe sur le emp table.
hbase(main):006:0> describe 'emp'
DESCRIPTION
ENABLED
'emp', {NAME ⇒ 'READONLY', DATA_BLOCK_ENCODING ⇒ 'NONE', BLOOMFILTER
⇒ 'ROW', REPLICATION_SCOPE ⇒ '0', COMPRESSION ⇒ 'NONE', VERSIONS ⇒
'1', TTL true
⇒ 'FOREVER', MIN_VERSIONS ⇒ '0', KEEP_DELETED_CELLS ⇒ 'false',
BLOCKSIZE ⇒ '65536', IN_MEMORY ⇒ 'false', BLOCKCACHE ⇒ 'true'}, {NAME
⇒ 'personal
data', DATA_BLOCK_ENCODING ⇒ 'NONE', BLOOMFILTER ⇒ 'ROW',
REPLICATION_SCOPE ⇒ '0', VERSIONS ⇒ '5', COMPRESSION ⇒ 'NONE',
MIN_VERSIONS ⇒ '0', TTL
⇒ 'FOREVER', KEEP_DELETED_CELLS ⇒ 'false', BLOCKSIZE ⇒ '65536',
IN_MEMORY ⇒ 'false', BLOCKCACHE ⇒ 'true'}, {NAME ⇒ 'professional
data', DATA_BLO
CK_ENCODING ⇒ 'NONE', BLOOMFILTER ⇒ 'ROW', REPLICATION_SCOPE ⇒ '0',
VERSIONS ⇒ '1', COMPRESSION ⇒ 'NONE', MIN_VERSIONS ⇒ '0', TTL ⇒
'FOREVER', K
EEP_DELETED_CELLS ⇒ 'false', BLOCKSIZE ⇒ '65536', IN_MEMORY ⇒
'false', BLOCKCACHE ⇒ 'true'}, {NAME ⇒ 'table_att_unset',
DATA_BLOCK_ENCODING ⇒ 'NO
NE', BLOOMFILTER ⇒ 'ROW', REPLICATION_SCOPE ⇒ '0', COMPRESSION ⇒
'NONE', VERSIONS ⇒ '1', TTL ⇒ 'FOREVER', MIN_VERSIONS ⇒ '0',
KEEP_DELETED_CELLS
⇒ 'false', BLOCKSIZE ⇒ '6
modifier
Alter est la commande utilisée pour apporter des modifications à une table existante. À l'aide de cette commande, vous pouvez modifier le nombre maximal de cellules d'une famille de colonnes, définir et supprimer des opérateurs d'étendue de table et supprimer une famille de colonnes d'une table.
Modification du nombre maximal de cellules d'une famille de colonnes
Vous trouverez ci-dessous la syntaxe permettant de modifier le nombre maximal de cellules d'une famille de colonnes.
hbase> alter 't1', NAME ⇒ 'f1', VERSIONS ⇒ 5
Dans l'exemple suivant, le nombre maximal de cellules est défini sur 5.
hbase(main):003:0> alter 'emp', NAME ⇒ 'personal data', VERSIONS ⇒ 5
Updating all regions with the new schema...
0/1 regions updated.
1/1 regions updated.
Done.
0 row(s) in 2.3050 seconds
Opérateurs de portée de table
En utilisant alter, vous pouvez définir et supprimer des opérateurs d'étendue de table tels que MAX_FILESIZE, READONLY, MEMSTORE_FLUSHSIZE, DEFERRED_LOG_FLUSH, etc.
Réglage en lecture seule
Vous trouverez ci-dessous la syntaxe pour rendre une table en lecture seule.
hbase>alter 't1', READONLY(option)
Dans l'exemple suivant, nous avons fait le emp table en lecture seule.
hbase(main):006:0> alter 'emp', READONLY
Updating all regions with the new schema...
0/1 regions updated.
1/1 regions updated.
Done.
0 row(s) in 2.2140 seconds
Suppression d'opérateurs de portée de table
Nous pouvons également supprimer les opérateurs d'étendue de table. Vous trouverez ci-dessous la syntaxe pour supprimer 'MAX_FILESIZE' de la table emp.
hbase> alter 't1', METHOD ⇒ 'table_att_unset', NAME ⇒ 'MAX_FILESIZE'
Suppression d'une famille de poteaux
En utilisant alter, vous pouvez également supprimer une famille de colonnes. Vous trouverez ci-dessous la syntaxe pour supprimer une famille de colonnes à l'aide de alter.
hbase> alter ‘ table name ’, ‘delete’ ⇒ ‘ column family ’
Vous trouverez ci-dessous un exemple pour supprimer une famille de colonnes de la table «emp».
Supposons qu'il existe une table nommée employee dans HBase. Il contient les données suivantes:
hbase(main):006:0> scan 'employee'
ROW COLUMN+CELL
row1 column = personal:city, timestamp = 1418193767, value = hyderabad
row1 column = personal:name, timestamp = 1418193806767, value = raju
row1 column = professional:designation, timestamp = 1418193767, value = manager
row1 column = professional:salary, timestamp = 1418193806767, value = 50000
1 row(s) in 0.0160 seconds
Supprimons maintenant la famille de colonnes nommée professional en utilisant la commande alter.
hbase(main):007:0> alter 'employee','delete'⇒'professional'
Updating all regions with the new schema...
0/1 regions updated.
1/1 regions updated.
Done.
0 row(s) in 2.2380 seconds
Vérifiez maintenant les données du tableau après modification. Observez que la famille de colonnes «professionnel» n'est plus, puisque nous l'avons supprimée.
hbase(main):003:0> scan 'employee'
ROW COLUMN + CELL
row1 column = personal:city, timestamp = 14181936767, value = hyderabad
row1 column = personal:name, timestamp = 1418193806767, value = raju
1 row(s) in 0.0830 seconds
Ajout d'une famille de colonnes à l'aide de l'API Java
Vous pouvez ajouter une famille de colonnes à une table à l'aide de la méthode addColumn() de HBAseAdminclasse. Suivez les étapes ci-dessous pour ajouter une famille de colonnes à un tableau.
Étape 1
Instancier le HBaseAdmin classe.
// Instantiating configuration object
Configuration conf = HBaseConfiguration.create();
// Instantiating HBaseAdmin class
HBaseAdmin admin = new HBaseAdmin(conf);
Étape 2
le addColumn() nécessite un nom de table et un objet de HColumnDescriptorclasse. Par conséquent instanciez leHColumnDescriptorclasse. Le constructeur deHColumnDescriptorà son tour, un nom de famille de colonnes doit être ajouté. Ici, nous ajoutons une famille de colonnes nommée «contactDetails» à la table «employé» existante.
// Instantiating columnDescriptor object
HColumnDescriptor columnDescriptor = new
HColumnDescriptor("contactDetails");
Étape 3
Ajoutez la famille de colonnes à l'aide de addColumnméthode. Passez le nom de la table et leHColumnDescriptor objet de classe comme paramètres de cette méthode.
// Adding column family
admin.addColumn("employee", new HColumnDescriptor("columnDescriptor"));
Vous trouverez ci-dessous le programme complet pour ajouter une famille de colonnes à une table existante.
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.HColumnDescriptor;
import org.apache.hadoop.hbase.MasterNotRunningException;
import org.apache.hadoop.hbase.client.HBaseAdmin;
public class AddColoumn{
public static void main(String args[]) throws MasterNotRunningException, IOException{
// Instantiating configuration class.
Configuration conf = HBaseConfiguration.create();
// Instantiating HBaseAdmin class.
HBaseAdmin admin = new HBaseAdmin(conf);
// Instantiating columnDescriptor class
HColumnDescriptor columnDescriptor = new HColumnDescriptor("contactDetails");
// Adding column family
admin.addColumn("employee", columnDescriptor);
System.out.println("coloumn added");
}
}
Compilez et exécutez le programme ci-dessus comme indiqué ci-dessous.
$javac AddColumn.java
$java AddColumn
La compilation ci-dessus ne fonctionne que si vous avez défini le chemin de classe dans " .bashrc». Si ce n'est pas le cas, suivez la procédure ci-dessous pour compiler votre fichier .java.
//if "/home/home/hadoop/hbase " is your Hbase home folder then.
$javac -cp /home/hadoop/hbase/lib/*: Demo.java
Si tout se passe bien, il produira la sortie suivante:
column added
Suppression d'une famille de colonnes à l'aide de l'API Java
Vous pouvez supprimer une famille de colonnes d'une table à l'aide de la méthode deleteColumn() de HBAseAdminclasse. Suivez les étapes ci-dessous pour ajouter une famille de colonnes à un tableau.
Étape 1
Instancier le HBaseAdmin classe.
// Instantiating configuration object
Configuration conf = HBaseConfiguration.create();
// Instantiating HBaseAdmin class
HBaseAdmin admin = new HBaseAdmin(conf);
Étape 2
Ajoutez la famille de colonnes à l'aide de deleteColumn()méthode. Transmettez le nom de la table et le nom de la famille de colonnes en tant que paramètres à cette méthode.
// Deleting column family
admin.deleteColumn("employee", "contactDetails");
Vous trouverez ci-dessous le programme complet pour supprimer une famille de colonnes d'une table existante.
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.MasterNotRunningException;
import org.apache.hadoop.hbase.client.HBaseAdmin;
public class DeleteColoumn{
public static void main(String args[]) throws MasterNotRunningException, IOException{
// Instantiating configuration class.
Configuration conf = HBaseConfiguration.create();
// Instantiating HBaseAdmin class.
HBaseAdmin admin = new HBaseAdmin(conf);
// Deleting a column family
admin.deleteColumn("employee","contactDetails");
System.out.println("coloumn deleted");
}
}
Compilez et exécutez le programme ci-dessus comme indiqué ci-dessous.
$javac DeleteColumn.java $java DeleteColumn
Ce qui suit devrait être la sortie:
column deleted
Existence d'une table utilisant HBase Shell
Vous pouvez vérifier l'existence d'une table à l'aide du existscommander. L'exemple suivant montre comment utiliser cette commande.
hbase(main):024:0> exists 'emp'
Table emp does exist
0 row(s) in 0.0750 seconds
==================================================================
hbase(main):015:0> exists 'student'
Table student does not exist
0 row(s) in 0.0480 seconds
Vérification de l'existence d'une table à l'aide de l'API Java
Vous pouvez vérifier l'existence d'une table dans HBase à l'aide du tableExists() méthode de la HBaseAdmin classe. Suivez les étapes ci-dessous pour vérifier l'existence d'une table dans HBase.
Étape 1
Instantiate the HBaseAdimn class
// Instantiating configuration object
Configuration conf = HBaseConfiguration.create();
// Instantiating HBaseAdmin class
HBaseAdmin admin = new HBaseAdmin(conf);
Étape 2
Vérifiez l'existence de la table à l'aide du tableExists( ) méthode.
Ci-dessous, le programme java pour tester l'existence d'une table dans HBase à l'aide de l'API java.
import java.io.IOException;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.client.HBaseAdmin;
public class TableExists{
public static void main(String args[])throws IOException{
// Instantiating configuration class
Configuration conf = HBaseConfiguration.create();
// Instantiating HBaseAdmin class
HBaseAdmin admin = new HBaseAdmin(conf);
// Verifying the existance of the table
boolean bool = admin.tableExists("emp");
System.out.println( bool);
}
}
Compilez et exécutez le programme ci-dessus comme indiqué ci-dessous.
$javac TableExists.java $java TableExists
Ce qui suit devrait être la sortie:
true
Suppression d'une table à l'aide de HBase Shell
En utilisant le dropcommande, vous pouvez supprimer une table. Avant de supprimer une table, vous devez la désactiver.
hbase(main):018:0> disable 'emp'
0 row(s) in 1.4580 seconds
hbase(main):019:0> drop 'emp'
0 row(s) in 0.3060 seconds
Vérifiez si la table est supprimée à l'aide de la commande exist.
hbase(main):020:07gt; exists 'emp'
Table emp does not exist
0 row(s) in 0.0730 seconds
drop_all
Cette commande est utilisée pour supprimer les tables correspondant au «regex» donné dans la commande. Sa syntaxe est la suivante:
hbase> drop_all ‘t.*’
Note: Avant de supprimer une table, vous devez la désactiver.
Exemple
Supposons qu'il existe des tables nommées raja, rajani, rajendra, rajesh et raju.
hbase(main):017:0> list
TABLE
raja
rajani
rajendra
rajesh
raju
9 row(s) in 0.0270 seconds
Tous ces tableaux commencent par les lettres raj. Tout d'abord, désactivons toutes ces tables en utilisant ledisable_all comme indiqué ci-dessous.
hbase(main):002:0> disable_all 'raj.*'
raja
rajani
rajendra
rajesh
raju
Disable the above 5 tables (y/n)?
y
5 tables successfully disabled
Vous pouvez maintenant les supprimer tous en utilisant le drop_all commande comme indiqué ci-dessous.
hbase(main):018:0> drop_all 'raj.*'
raja
rajani
rajendra
rajesh
raju
Drop the above 5 tables (y/n)?
y
5 tables successfully dropped
Suppression d'une table à l'aide de l'API Java
Vous pouvez supprimer une table à l'aide du deleteTable() méthode dans le HBaseAdminclasse. Suivez les étapes ci-dessous pour supprimer une table à l'aide de l'API java.
Étape 1
Instanciez la classe HBaseAdmin.
// creating a configuration object
Configuration conf = HBaseConfiguration.create();
// Creating HBaseAdmin object
HBaseAdmin admin = new HBaseAdmin(conf);
Étape 2
Désactivez la table à l'aide de disableTable() méthode de la HBaseAdmin classe.
admin.disableTable("emp1");
Étape 3
Supprimez maintenant le tableau en utilisant le deleteTable() méthode de la HBaseAdmin classe.
admin.deleteTable("emp12");
Vous trouverez ci-dessous le programme Java complet pour supprimer une table dans HBase.
import java.io.IOException;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.client.HBaseAdmin;
public class DeleteTable {
public static void main(String[] args) throws IOException {
// Instantiating configuration class
Configuration conf = HBaseConfiguration.create();
// Instantiating HBaseAdmin class
HBaseAdmin admin = new HBaseAdmin(conf);
// disabling table named emp
admin.disableTable("emp12");
// Deleting emp
admin.deleteTable("emp12");
System.out.println("Table deleted");
}
}
Compilez et exécutez le programme ci-dessus comme indiqué ci-dessous.
$javac DeleteTable.java $java DeleteTable
Ce qui suit devrait être la sortie:
Table deleted
sortie
Vous quittez le shell en tapant le exit commander.
hbase(main):021:0> exit
Arrêt de HBase
Pour arrêter HBase, accédez au dossier de base HBase et tapez la commande suivante.
./bin/stop-hbase.sh
Arrêt de HBase à l'aide de l'API Java
Vous pouvez arrêter le HBase en utilisant le shutdown() méthode de la HBaseAdminclasse. Suivez les étapes ci-dessous pour arrêter HBase:
Étape 1
Instanciez la classe HbaseAdmin.
// Instantiating configuration object
Configuration conf = HBaseConfiguration.create();
// Instantiating HBaseAdmin object
HBaseAdmin admin = new HBaseAdmin(conf);
Étape 2
Arrêtez le HBase à l'aide du shutdown() méthode de la HBaseAdmin classe.
admin.shutdown();
Ci-dessous est le programme pour arrêter la HBase.
import java.io.IOException;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.client.HBaseAdmin;
public class ShutDownHbase{
public static void main(String args[])throws IOException {
// Instantiating configuration class
Configuration conf = HBaseConfiguration.create();
// Instantiating HBaseAdmin class
HBaseAdmin admin = new HBaseAdmin(conf);
// Shutting down HBase
System.out.println("Shutting down hbase");
admin.shutdown();
}
}
Compilez et exécutez le programme ci-dessus comme indiqué ci-dessous.
$javac ShutDownHbase.java $java ShutDownHbase
Ce qui suit devrait être la sortie:
Shutting down hbase
Ce chapitre décrit l'API client Java pour HBase utilisée pour effectuer CRUDopérations sur les tables HBase. HBase est écrit en Java et possède une API Java native. Par conséquent, il fournit un accès par programme au langage de manipulation de données (DML).
Configuration de la classe HBase
Ajoute les fichiers de configuration HBase à une configuration. Cette classe appartient à laorg.apache.hadoop.hbase paquet.
Méthodes et description
S.No. | Méthodes et description |
---|---|
1 | static org.apache.hadoop.conf.Configuration create() Cette méthode crée une configuration avec des ressources HBase. |
Classe HTable
HTable est une classe interne HBase qui représente une table HBase. Il s'agit d'une implémentation de table utilisée pour communiquer avec une seule table HBase. Cette classe appartient à laorg.apache.hadoop.hbase.client classe.
Constructeurs
S.No. | Constructeurs et description |
---|---|
1 | HTable() |
2 | HTable(TableName tableName, ClusterConnection connection, ExecutorService pool) À l'aide de ce constructeur, vous pouvez créer un objet pour accéder à une table HBase. |
Méthodes et description
S.No. | Méthodes et description |
---|---|
1 | void close() Libère toutes les ressources du HTable. |
2 | void delete(Delete delete) Supprime les cellules / lignes spécifiées. |
3 | boolean exists(Get get) À l'aide de cette méthode, vous pouvez tester l'existence de colonnes dans la table, comme spécifié par Get. |
4 | Result get(Get get) Récupère certaines cellules d'une ligne donnée. |
5 | org.apache.hadoop.conf.Configuration getConfiguration() Renvoie l'objet Configuration utilisé par cette instance. |
6 | TableName getName() Renvoie l'instance de nom de table de cette table. |
sept | HTableDescriptor getTableDescriptor() Renvoie le descripteur de table pour cette table. |
8 | byte[] getTableName() Renvoie le nom de cette table. |
9 | void put(Put put) En utilisant cette méthode, vous pouvez insérer des données dans la table. |
Classe Put
Cette classe est utilisée pour effectuer des opérations Put pour une seule ligne. Il appartient à laorg.apache.hadoop.hbase.client paquet.
Constructeurs
S.No. | Constructeurs et description |
---|---|
1 | Put(byte[] row) À l'aide de ce constructeur, vous pouvez créer une opération Put pour la ligne spécifiée. |
2 | Put(byte[] rowArray, int rowOffset, int rowLength) À l'aide de ce constructeur, vous pouvez créer une copie de la clé de ligne transmise pour la conserver en local. |
3 | Put(byte[] rowArray, int rowOffset, int rowLength, long ts) À l'aide de ce constructeur, vous pouvez créer une copie de la clé de ligne transmise pour la conserver en local. |
4 | Put(byte[] row, long ts) En utilisant ce constructeur, nous pouvons créer une opération Put pour la ligne spécifiée, en utilisant un horodatage donné. |
Méthodes
S.No. | Méthodes et description |
---|---|
1 | Put add(byte[] family, byte[] qualifier, byte[] value) Ajoute la colonne et la valeur spécifiées à cette opération Put. |
2 | Put add(byte[] family, byte[] qualifier, long ts, byte[] value) Ajoute la colonne et la valeur spécifiées, avec l'horodatage spécifié comme version à cette opération Put. |
3 | Put add(byte[] family, ByteBuffer qualifier, long ts, ByteBuffer value) Ajoute la colonne et la valeur spécifiées, avec l'horodatage spécifié comme version à cette opération Put. |
4 | Put add(byte[] family, ByteBuffer qualifier, long ts, ByteBuffer value) Ajoute la colonne et la valeur spécifiées, avec l'horodatage spécifié comme version à cette opération Put. |
Classe Get
Cette classe est utilisée pour effectuer des opérations Get sur une seule ligne. Cette classe appartient à laorg.apache.hadoop.hbase.client paquet.
Constructeur
S.No. | Constructeur et description |
---|---|
1 | Get(byte[] row) À l'aide de ce constructeur, vous pouvez créer une opération Get pour la ligne spécifiée. |
2 | Get(Get get) |
Méthodes
S.No. | Méthodes et description |
---|---|
1 | Get addColumn(byte[] family, byte[] qualifier) Récupère la colonne de la famille spécifique avec le qualificatif spécifié. |
2 | Get addFamily(byte[] family) Récupère toutes les colonnes de la famille spécifiée. |
Class Delete
This class is used to perform Delete operations on a single row. To delete an entire row, instantiate a Delete object with the row to delete. This class belongs to the org.apache.hadoop.hbase.client package.
Constructor
S.No. | Constructor and Description |
---|---|
1 | Delete(byte[] row) Creates a Delete operation for the specified row. |
2 | Delete(byte[] rowArray, int rowOffset, int rowLength) Creates a Delete operation for the specified row and timestamp. |
3 | Delete(byte[] rowArray, int rowOffset, int rowLength, long ts) Creates a Delete operation for the specified row and timestamp. |
4 | Delete(byte[] row, long timestamp) Creates a Delete operation for the specified row and timestamp. |
Methods
S.No. | Methods and Description |
---|---|
1 | Delete addColumn(byte[] family, byte[] qualifier) Deletes the latest version of the specified column. |
2 | Delete addColumns(byte[] family, byte[] qualifier, long timestamp) Deletes all versions of the specified column with a timestamp less than or equal to the specified timestamp. |
3 | Delete addFamily(byte[] family) Deletes all versions of all columns of the specified family. |
4 | Delete addFamily(byte[] family, long timestamp) Deletes all columns of the specified family with a timestamp less than or equal to the specified timestamp. |
Class Result
This class is used to get a single row result of a Get or a Scan query.
Constructors
S.No. | Constructors |
---|---|
1 | Result() Using this constructor, you can create an empty Result with no KeyValue payload; returns null if you call raw Cells(). |
Methods
S.No. | Methods and Description |
---|---|
1 | byte[] getValue(byte[] family, byte[] qualifier) This method is used to get the latest version of the specified column. |
2 | byte[] getRow() This method is used to retrieve the row key that corresponds to the row from which this Result was created. |
Inserting Data using HBase Shell
This chapter demonstrates how to create data in an HBase table. To create data in an HBase table, the following commands and methods are used:
put command,
add() method of Put class, and
put() method of HTable class.
As an example, we are going to create the following table in HBase.
Using put command, you can insert rows into a table. Its syntax is as follows:
put ’<table name>’,’row1’,’<colfamily:colname>’,’<value>’
Inserting the First Row
Let us insert the first row values into the emp table as shown below.
hbase(main):005:0> put 'emp','1','personal data:name','raju'
0 row(s) in 0.6600 seconds
hbase(main):006:0> put 'emp','1','personal data:city','hyderabad'
0 row(s) in 0.0410 seconds
hbase(main):007:0> put 'emp','1','professional
data:designation','manager'
0 row(s) in 0.0240 seconds
hbase(main):007:0> put 'emp','1','professional data:salary','50000'
0 row(s) in 0.0240 seconds
Insert the remaining rows using the put command in the same way. If you insert the whole table, you will get the following output.
hbase(main):022:0> scan 'emp'
ROW COLUMN+CELL
1 column=personal data:city, timestamp=1417524216501, value=hyderabad
1 column=personal data:name, timestamp=1417524185058, value=ramu
1 column=professional data:designation, timestamp=1417524232601,
value=manager
1 column=professional data:salary, timestamp=1417524244109, value=50000
2 column=personal data:city, timestamp=1417524574905, value=chennai
2 column=personal data:name, timestamp=1417524556125, value=ravi
2 column=professional data:designation, timestamp=1417524592204,
value=sr:engg
2 column=professional data:salary, timestamp=1417524604221, value=30000
3 column=personal data:city, timestamp=1417524681780, value=delhi
3 column=personal data:name, timestamp=1417524672067, value=rajesh
3 column=professional data:designation, timestamp=1417524693187,
value=jr:engg
3 column=professional data:salary, timestamp=1417524702514,
value=25000
Inserting Data Using Java API
You can insert data into Hbase using the add() method of the Put class. You can save it using the put() method of the HTable class. These classes belong to the org.apache.hadoop.hbase.client package. Below given are the steps to create data in a Table of HBase.
Step 1:Instantiate the Configuration Class
The Configuration class adds HBase configuration files to its object. You can create a configuration object using the create() method of the HbaseConfiguration class as shown below.
Configuration conf = HbaseConfiguration.create();
Step 2:Instantiate the HTable Class
You have a class called HTable, an implementation of Table in HBase. This class is used to communicate with a single HBase table. While instantiating this class, it accepts configuration object and table name as parameters. You can instantiate HTable class as shown below.
HTable hTable = new HTable(conf, tableName);
Step 3: Instantiate the PutClass
To insert data into an HBase table, the add() method and its variants are used. This method belongs to Put, therefore instantiate the put class. This class requires the row name you want to insert the data into, in string format. You can instantiate the Put class as shown below.
Put p = new Put(Bytes.toBytes("row1"));
Step 4: InsertData
The add() method of Put class is used to insert data. It requires 3 byte arrays representing column family, column qualifier (column name), and the value to be inserted, respectively. Insert data into the HBase table using the add() method as shown below.
p.add(Bytes.toBytes("coloumn family "), Bytes.toBytes("column
name"),Bytes.toBytes("value"));
Step 5: Save the Data in Table
After inserting the required rows, save the changes by adding the put instance to the put() method of HTable class as shown below.
hTable.put(p);
Step 6: Close the HTable Instance
After creating data in the HBase Table, close the HTable instance using the close() method as shown below.
hTable.close();
Given below is the complete program to create data in HBase Table.
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.client.HTable;
import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.util.Bytes;
public class InsertData{
public static void main(String[] args) throws IOException {
// Instantiating Configuration class
Configuration config = HBaseConfiguration.create();
// Instantiating HTable class
HTable hTable = new HTable(config, "emp");
// Instantiating Put class
// accepts a row name.
Put p = new Put(Bytes.toBytes("row1"));
// adding values using add() method
// accepts column family name, qualifier/row name ,value
p.add(Bytes.toBytes("personal"),
Bytes.toBytes("name"),Bytes.toBytes("raju"));
p.add(Bytes.toBytes("personal"),
Bytes.toBytes("city"),Bytes.toBytes("hyderabad"));
p.add(Bytes.toBytes("professional"),Bytes.toBytes("designation"),
Bytes.toBytes("manager"));
p.add(Bytes.toBytes("professional"),Bytes.toBytes("salary"),
Bytes.toBytes("50000"));
// Saving the put Instance to the HTable.
hTable.put(p);
System.out.println("data inserted");
// closing HTable
hTable.close();
}
}
Compile and execute the above program as shown below.
$javac InsertData.java $java InsertData
The following should be the output:
data inserted
Updating Data using HBase Shell
You can update an existing cell value using the put command. To do so, just follow the same syntax and mention your new value as shown below.
put ‘table name’,’row ’,'Column family:column name',’new value’
The newly given value replaces the existing value, updating the row.
Example
Suppose there is a table in HBase called emp with the following data.
hbase(main):003:0> scan 'emp'
ROW COLUMN + CELL
row1 column = personal:name, timestamp = 1418051555, value = raju
row1 column = personal:city, timestamp = 1418275907, value = Hyderabad
row1 column = professional:designation, timestamp = 14180555,value = manager
row1 column = professional:salary, timestamp = 1418035791555,value = 50000
1 row(s) in 0.0100 seconds
The following command will update the city value of the employee named ‘Raju’ to Delhi.
hbase(main):002:0> put 'emp','row1','personal:city','Delhi'
0 row(s) in 0.0400 seconds
The updated table looks as follows where you can observe the city of Raju has been changed to ‘Delhi’.
hbase(main):003:0> scan 'emp'
ROW COLUMN + CELL
row1 column = personal:name, timestamp = 1418035791555, value = raju
row1 column = personal:city, timestamp = 1418274645907, value = Delhi
row1 column = professional:designation, timestamp = 141857555,value = manager
row1 column = professional:salary, timestamp = 1418039555, value = 50000
1 row(s) in 0.0100 seconds
Updating Data Using Java API
You can update the data in a particular cell using the put() method. Follow the steps given below to update an existing cell value of a table.
Step 1: Instantiate the Configuration Class
Configuration class adds HBase configuration files to its object. You can create a configuration object using the create() method of the HbaseConfiguration class as shown below.
Configuration conf = HbaseConfiguration.create();
Step 2: Instantiate the HTable Class
You have a class called HTable, an implementation of Table in HBase. This class is used to communicate with a single HBase table. While instantiating this class, it accepts the configuration object and the table name as parameters. You can instantiate the HTable class as shown below.
HTable hTable = new HTable(conf, tableName);
Step 3: Instantiate the Put Class
To insert data into HBase Table, the add() method and its variants are used. This method belongs to Put, therefore instantiate the put class. This class requires the row name you want to insert the data into, in string format. You can instantiate the Put class as shown below.
Put p = new Put(Bytes.toBytes("row1"));
Step 4: Update an Existing Cell
The add() method of Put class is used to insert data. It requires 3 byte arrays representing column family, column qualifier (column name), and the value to be inserted, respectively. Insert data into HBase table using the add() method as shown below.
p.add(Bytes.toBytes("coloumn family "), Bytes.toBytes("column
name"),Bytes.toBytes("value"));
p.add(Bytes.toBytes("personal"),
Bytes.toBytes("city"),Bytes.toBytes("Delih"));
Step 5: Save the Data in Table
After inserting the required rows, save the changes by adding the put instance to the put() method of the HTable class as shown below.
hTable.put(p);
Step 6: Close HTable Instance
After creating data in HBase Table, close the HTable instance using the close() method as shown below.
hTable.close();
Given below is the complete program to update data in a particular table.
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.client.HTable;
import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.util.Bytes;
public class UpdateData{
public static void main(String[] args) throws IOException {
// Instantiating Configuration class
Configuration config = HBaseConfiguration.create();
// Instantiating HTable class
HTable hTable = new HTable(config, "emp");
// Instantiating Put class
//accepts a row name
Put p = new Put(Bytes.toBytes("row1"));
// Updating a cell value
p.add(Bytes.toBytes("personal"),
Bytes.toBytes("city"),Bytes.toBytes("Delih"));
// Saving the put Instance to the HTable.
hTable.put(p);
System.out.println("data Updated");
// closing HTable
hTable.close();
}
}
Compile and execute the above program as shown below.
$javac UpdateData.java $java UpdateData
The following should be the output:
data Updated
Reading Data using HBase Shell
The get command and the get() method of HTable class are used to read data from a table in HBase. Using get command, you can get a single row of data at a time. Its syntax is as follows:
get ’<table name>’,’row1’
Example
The following example shows how to use the get command. Let us scan the first row of the emp table.
hbase(main):012:0> get 'emp', '1'
COLUMN CELL
personal : city timestamp = 1417521848375, value = hyderabad
personal : name timestamp = 1417521785385, value = ramu
professional: designation timestamp = 1417521885277, value = manager
professional: salary timestamp = 1417521903862, value = 50000
4 row(s) in 0.0270 seconds
Reading a Specific Column
Given below is the syntax to read a specific column using the get method.
hbase> get 'table name', ‘rowid’, {COLUMN ⇒ ‘column family:column name ’}
Example
Given below is the example to read a specific column in HBase table.
hbase(main):015:0> get 'emp', 'row1', {COLUMN ⇒ 'personal:name'}
COLUMN CELL
personal:name timestamp = 1418035791555, value = raju
1 row(s) in 0.0080 seconds
Reading Data Using Java API
To read data from an HBase table, use the get() method of the HTable class. This method requires an instance of the Get class. Follow the steps given below to retrieve data from the HBase table.
Step 1: Instantiate the Configuration Class
Configuration class adds HBase configuration files to its object. You can create a configuration object using the create() method of the HbaseConfiguration class as shown below.
Configuration conf = HbaseConfiguration.create();
Step 2: Instantiate the HTable Class
You have a class called HTable, an implementation of Table in HBase. This class is used to communicate with a single HBase table. While instantiating this class, it accepts the configuration object and the table name as parameters. You can instantiate the HTable class as shown below.
HTable hTable = new HTable(conf, tableName);
Step 3: Instantiate the Get Class
You can retrieve data from the HBase table using the get() method of the HTable class. This method extracts a cell from a given row. It requires a Get class object as parameter. Create it as shown below.
Get get = new Get(toBytes("row1"));
Step 4: Read the Data
While retrieving data, you can get a single row by id, or get a set of rows by a set of row ids, or scan an entire table or a subset of rows.
You can retrieve an HBase table data using the add method variants in Get class.
To get a specific column from a specific column family, use the following method.
get.addFamily(personal)
To get all the columns from a specific column family, use the following method.
get.addColumn(personal, name)
Step 5: Get the Result
Get the result by passing your Get class instance to the get method of the HTable class. This method returns the Result class object, which holds the requested result. Given below is the usage of get() method.
Result result = table.get(g);
Step 6: Reading Values from the Result Instance
The Result class provides the getValue() method to read the values from its instance. Use it as shown below to read the values from the Result instance.
byte [] value = result.getValue(Bytes.toBytes("personal"),Bytes.toBytes("name"));
byte [] value1 = result.getValue(Bytes.toBytes("personal"),Bytes.toBytes("city"));
Given below is the complete program to read values from an HBase table.
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.client.Get;
import org.apache.hadoop.hbase.client.HTable;
import org.apache.hadoop.hbase.client.Result;
import org.apache.hadoop.hbase.util.Bytes;
public class RetriveData{
public static void main(String[] args) throws IOException, Exception{
// Instantiating Configuration class
Configuration config = HBaseConfiguration.create();
// Instantiating HTable class
HTable table = new HTable(config, "emp");
// Instantiating Get class
Get g = new Get(Bytes.toBytes("row1"));
// Reading the data
Result result = table.get(g);
// Reading values from Result class object
byte [] value = result.getValue(Bytes.toBytes("personal"),Bytes.toBytes("name"));
byte [] value1 = result.getValue(Bytes.toBytes("personal"),Bytes.toBytes("city"));
// Printing the values
String name = Bytes.toString(value);
String city = Bytes.toString(value1);
System.out.println("name: " + name + " city: " + city);
}
}
Compile and execute the above program as shown below.
$javac RetriveData.java $java RetriveData
The following should be the output:
name: Raju city: Delhi
Deleting a Specific Cell in a Table
Using the delete command, you can delete a specific cell in a table. The syntax of delete command is as follows:
delete ‘<table name>’, ‘<row>’, ‘<column name >’, ‘<time stamp>’
Example
Here is an example to delete a specific cell. Here we are deleting the salary.
hbase(main):006:0> delete 'emp', '1', 'personal data:city',
1417521848375
0 row(s) in 0.0060 seconds
Deleting All Cells in a Table
Using the “deleteall” command, you can delete all the cells in a row. Given below is the syntax of deleteall command.
deleteall ‘<table name>’, ‘<row>’,
Example
Here is an example of “deleteall” command, where we are deleting all the cells of row1 of emp table.
hbase(main):007:0> deleteall 'emp','1'
0 row(s) in 0.0240 seconds
Vérifiez le tableau à l'aide du scancommander. Un aperçu du tableau après la suppression du tableau est donné ci-dessous.
hbase(main):022:0> scan 'emp'
ROW COLUMN + CELL
2 column = personal data:city, timestamp = 1417524574905, value = chennai
2 column = personal data:name, timestamp = 1417524556125, value = ravi
2 column = professional data:designation, timestamp = 1417524204, value = sr:engg
2 column = professional data:salary, timestamp = 1417524604221, value = 30000
3 column = personal data:city, timestamp = 1417524681780, value = delhi
3 column = personal data:name, timestamp = 1417524672067, value = rajesh
3 column = professional data:designation, timestamp = 1417523187, value = jr:engg
3 column = professional data:salary, timestamp = 1417524702514, value = 25000
Suppression de données à l'aide de l'API Java
Vous pouvez supprimer des données d'une table HBase à l'aide du delete() méthode de la HTableclasse. Suivez les étapes ci-dessous pour supprimer des données d'un tableau.
Étape 1: instancier la classe de configuration
ConfigurationLa classe ajoute des fichiers de configuration HBase à son objet. Vous pouvez créer un objet de configuration à l'aide ducreate() méthode de la HbaseConfiguration classe comme indiqué ci-dessous.
Configuration conf = HbaseConfiguration.create();
Étape 2: instancier la classe HTable
Vous avez une classe appelée HTable, une implémentation de Table dans HBase. Cette classe est utilisée pour communiquer avec une seule table HBase. Lors de l'instanciation de cette classe, elle accepte l'objet de configuration et le nom de la table comme paramètres. Vous pouvez instancier la classe HTable comme indiqué ci-dessous.
HTable hTable = new HTable(conf, tableName);
Étape 3: instancier la classe de suppression
Instancier le Deleteclass en passant l'ID de ligne de la ligne à supprimer, au format tableau d'octets. Vous pouvez également transmettre l'horodatage et Rowlock à ce constructeur.
Delete delete = new Delete(toBytes("row1"));
Étape 4: Sélectionnez les données à supprimer
Vous pouvez supprimer les données à l'aide des méthodes de suppression du Deleteclasse. Cette classe a différentes méthodes de suppression. Choisissez les colonnes ou familles de colonnes à supprimer à l'aide de ces méthodes. Jetez un œil aux exemples suivants qui montrent l'utilisation des méthodes de classe Delete.
delete.deleteColumn(Bytes.toBytes("personal"), Bytes.toBytes("name"));
delete.deleteFamily(Bytes.toBytes("professional"));
Étape 5: supprimer les données
Supprimez les données sélectionnées en passant le delete instance à la delete() méthode de la HTable classe comme indiqué ci-dessous.
table.delete(delete);
Étape 6: fermez HTableInstance
Après avoir supprimé les données, fermez le HTable Exemple.
table.close();
Vous trouverez ci-dessous le programme complet pour supprimer des données de la table HBase.
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.client.Delete;
import org.apache.hadoop.hbase.client.HTable;
import org.apache.hadoop.hbase.util.Bytes;
public class DeleteData {
public static void main(String[] args) throws IOException {
// Instantiating Configuration class
Configuration conf = HBaseConfiguration.create();
// Instantiating HTable class
HTable table = new HTable(conf, "employee");
// Instantiating Delete class
Delete delete = new Delete(Bytes.toBytes("row1"));
delete.deleteColumn(Bytes.toBytes("personal"), Bytes.toBytes("name"));
delete.deleteFamily(Bytes.toBytes("professional"));
// deleting the data
table.delete(delete);
// closing the HTable object
table.close();
System.out.println("data deleted.....");
}
}
Compilez et exécutez le programme ci-dessus comme indiqué ci-dessous.
$javac Deletedata.java $java DeleteData
Ce qui suit devrait être la sortie:
data deleted
Analyse à l'aide de HBase Shell
le scanLa commande est utilisée pour afficher les données dans HTable. En utilisant la commande scan, vous pouvez obtenir les données de la table. Sa syntaxe est la suivante:
scan ‘<table name>’
Exemple
L'exemple suivant montre comment lire les données d'une table à l'aide de la commande scan. Ici, nous lisons leemp table.
hbase(main):010:0> scan 'emp'
ROW COLUMN + CELL
1 column = personal data:city, timestamp = 1417521848375, value = hyderabad
1 column = personal data:name, timestamp = 1417521785385, value = ramu
1 column = professional data:designation, timestamp = 1417585277,value = manager
1 column = professional data:salary, timestamp = 1417521903862, value = 50000
1 row(s) in 0.0370 seconds
Analyse à l'aide de l'API Java
Le programme complet pour analyser toutes les données de la table à l'aide de l'API Java est le suivant.
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.hadoop.hbase.client.HTable;
import org.apache.hadoop.hbase.client.Result;
import org.apache.hadoop.hbase.client.ResultScanner;
import org.apache.hadoop.hbase.client.Scan;
public class ScanTable{
public static void main(String args[]) throws IOException{
// Instantiating Configuration class
Configuration config = HBaseConfiguration.create();
// Instantiating HTable class
HTable table = new HTable(config, "emp");
// Instantiating the Scan class
Scan scan = new Scan();
// Scanning the required columns
scan.addColumn(Bytes.toBytes("personal"), Bytes.toBytes("name"));
scan.addColumn(Bytes.toBytes("personal"), Bytes.toBytes("city"));
// Getting the scan result
ResultScanner scanner = table.getScanner(scan);
// Reading values from scan result
for (Result result = scanner.next(); result != null; result = Scanner.next())
System.out.println("Found row : " + result);
//closing the scanner
scanner.close();
}
}
Compilez et exécutez le programme ci-dessus comme indiqué ci-dessous.
$javac ScanTable.java $java ScanTable
Ce qui suit devrait être la sortie:
Found row :
keyvalues={row1/personal:city/1418275612888/Put/vlen=5/mvcc=0,
row1/personal:name/1418035791555/Put/vlen=4/mvcc=0}
compter
Vous pouvez compter le nombre de lignes d'un tableau à l'aide du countcommander. Sa syntaxe est la suivante:
count ‘<table name>’
Après avoir supprimé la première ligne, la table emp aura deux lignes. Vérifiez-le comme indiqué ci-dessous.
hbase(main):023:0> count 'emp'
2 row(s) in 0.090 seconds
⇒ 2
tronquer
Cette commande désactive les suppressions et recrée une table. La syntaxe detruncate est comme suit:
hbase> truncate 'table name'
Exemple
Ci-dessous est l'exemple de la commande truncate. Ici, nous avons tronqué leemp table.
hbase(main):011:0> truncate 'emp'
Truncating 'one' table (it may take a while):
- Disabling table...
- Truncating table...
0 row(s) in 1.5950 seconds
Après avoir tronqué la table, utilisez la commande scan pour vérifier. Vous obtiendrez une table avec zéro ligne.
hbase(main):017:0> scan ‘emp’
ROW COLUMN + CELL
0 row(s) in 0.3110 seconds
Nous pouvons accorder et révoquer des autorisations aux utilisateurs dans HBase. Il existe trois commandes à des fins de sécurité: grant, revoke et user_permission.
subvention
le grantLa commande accorde des droits spécifiques tels que lire, écrire, exécuter et administrer sur une table à un certain utilisateur. La syntaxe de la commande grant est la suivante:
hbase> grant <user> <permissions> [<table> [<column family> [<column; qualifier>]]
Nous pouvons accorder zéro ou plusieurs privilèges à un utilisateur de l'ensemble de RWXCA, où
- R - représente le privilège de lecture.
- W - représente le privilège d'écriture.
- X - représente le privilège d'exécution.
- C - représente le privilège de création.
- A - représente le privilège d'administrateur.
Vous trouverez ci-dessous un exemple qui accorde tous les privilèges à un utilisateur nommé «Tutorialspoint».
hbase(main):018:0> grant 'Tutorialspoint', 'RWXCA'
révoquer
le revokeLa commande est utilisée pour révoquer les droits d'accès d'un utilisateur à une table. Sa syntaxe est la suivante:
hbase> revoke <user>
Le code suivant révoque toutes les autorisations de l'utilisateur nommé «Tutorialspoint».
hbase(main):006:0> revoke 'Tutorialspoint'
user_permission
Cette commande est utilisée pour lister toutes les autorisations pour une table particulière. La syntaxe deuser_permission est comme suit:
hbase>user_permission ‘tablename’
Le code suivant répertorie toutes les autorisations utilisateur de la table 'emp'.
hbase(main):013:0> user_permission 'emp'