HBase - Décrire et modifier

décris

Cette commande renvoie la description de la table. Sa syntaxe est la suivante:

hbase> describe 'table name'

Vous trouverez ci-dessous la sortie de la commande describe sur le emp table.

hbase(main):006:0> describe 'emp'
   DESCRIPTION
      ENABLED
      
'emp', {NAME ⇒ 'READONLY', DATA_BLOCK_ENCODING ⇒ 'NONE', BLOOMFILTER
⇒ 'ROW', REPLICATION_SCOPE ⇒ '0', COMPRESSION ⇒ 'NONE', VERSIONS ⇒
'1', TTL true

⇒ 'FOREVER', MIN_VERSIONS ⇒ '0', KEEP_DELETED_CELLS ⇒ 'false',
BLOCKSIZE ⇒ '65536', IN_MEMORY ⇒ 'false', BLOCKCACHE ⇒ 'true'}, {NAME
⇒ 'personal

data', DATA_BLOCK_ENCODING ⇒ 'NONE', BLOOMFILTER ⇒ 'ROW',
REPLICATION_SCOPE ⇒ '0', VERSIONS ⇒ '5', COMPRESSION ⇒ 'NONE',
MIN_VERSIONS ⇒ '0', TTL

⇒ 'FOREVER', KEEP_DELETED_CELLS ⇒ 'false', BLOCKSIZE ⇒ '65536',
IN_MEMORY ⇒ 'false', BLOCKCACHE ⇒ 'true'}, {NAME ⇒ 'professional
data', DATA_BLO

CK_ENCODING ⇒ 'NONE', BLOOMFILTER ⇒ 'ROW', REPLICATION_SCOPE ⇒ '0',
VERSIONS ⇒ '1', COMPRESSION ⇒ 'NONE', MIN_VERSIONS ⇒ '0', TTL ⇒
'FOREVER', K

EEP_DELETED_CELLS ⇒ 'false', BLOCKSIZE ⇒ '65536', IN_MEMORY ⇒
'false', BLOCKCACHE ⇒ 'true'}, {NAME ⇒ 'table_att_unset',
DATA_BLOCK_ENCODING ⇒ 'NO 

NE', BLOOMFILTER ⇒ 'ROW', REPLICATION_SCOPE ⇒ '0', COMPRESSION ⇒
'NONE', VERSIONS ⇒ '1', TTL ⇒ 'FOREVER', MIN_VERSIONS ⇒ '0',
KEEP_DELETED_CELLS

⇒ 'false', BLOCKSIZE ⇒ '6

modifier

Alter est la commande utilisée pour apporter des modifications à une table existante. À l'aide de cette commande, vous pouvez modifier le nombre maximal de cellules d'une famille de colonnes, définir et supprimer des opérateurs d'étendue de table et supprimer une famille de colonnes d'une table.

Modification du nombre maximal de cellules d'une famille de colonnes

Vous trouverez ci-dessous la syntaxe permettant de modifier le nombre maximal de cellules d'une famille de colonnes.

hbase> alter 't1', NAME ⇒ 'f1', VERSIONS ⇒ 5

Dans l'exemple suivant, le nombre maximal de cellules est défini sur 5.

hbase(main):003:0> alter 'emp', NAME ⇒ 'personal data', VERSIONS ⇒ 5
Updating all regions with the new schema...
0/1 regions updated.
1/1 regions updated.
Done.
0 row(s) in 2.3050 seconds

Opérateurs de portée de table

En utilisant alter, vous pouvez définir et supprimer des opérateurs d'étendue de table tels que MAX_FILESIZE, READONLY, MEMSTORE_FLUSHSIZE, DEFERRED_LOG_FLUSH, etc.

Réglage en lecture seule

Vous trouverez ci-dessous la syntaxe pour rendre une table en lecture seule.

hbase>alter 't1', READONLY(option)

Dans l'exemple suivant, nous avons fait le emp table en lecture seule.

hbase(main):006:0> alter 'emp', READONLY
Updating all regions with the new schema...
0/1 regions updated.
1/1 regions updated.
Done.
0 row(s) in 2.2140 seconds

Suppression d'opérateurs de portée de table

Nous pouvons également supprimer les opérateurs d'étendue de table. Vous trouverez ci-dessous la syntaxe pour supprimer 'MAX_FILESIZE' de la table emp.

hbase> alter 't1', METHOD ⇒ 'table_att_unset', NAME ⇒ 'MAX_FILESIZE'

Suppression d'une famille de poteaux

En utilisant alter, vous pouvez également supprimer une famille de colonnes. Vous trouverez ci-dessous la syntaxe pour supprimer une famille de colonnes à l'aide de alter.

hbase> alter ‘ table name ’, ‘delete’ ⇒ ‘ column family ’

Vous trouverez ci-dessous un exemple pour supprimer une famille de colonnes de la table «emp».

Supposons qu'il existe une table nommée employee dans HBase. Il contient les données suivantes:

hbase(main):006:0> scan 'employee'

   ROW                   COLUMN+CELL

row1 column = personal:city, timestamp = 1418193767, value = hyderabad

row1 column = personal:name, timestamp = 1418193806767, value = raju

row1 column = professional:designation, timestamp = 1418193767, value = manager

row1 column = professional:salary, timestamp = 1418193806767, value = 50000

1 row(s) in 0.0160 seconds

Supprimons maintenant la famille de colonnes nommée professional en utilisant la commande alter.

hbase(main):007:0> alter 'employee','delete'⇒'professional'
Updating all regions with the new schema...
0/1 regions updated.
1/1 regions updated.
Done.
0 row(s) in 2.2380 seconds

Vérifiez maintenant les données du tableau après modification. Observez que la famille de colonnes «professionnel» n'est plus, puisque nous l'avons supprimée.

hbase(main):003:0> scan 'employee'
   ROW             COLUMN + CELL
row1 column = personal:city, timestamp = 14181936767, value = hyderabad

row1 column = personal:name, timestamp = 1418193806767, value = raju

1 row(s) in 0.0830 seconds

Ajout d'une famille de colonnes à l'aide de l'API Java

Vous pouvez ajouter une famille de colonnes à une table à l'aide de la méthode addColumn() de HBAseAdminclasse. Suivez les étapes ci-dessous pour ajouter une famille de colonnes à un tableau.

Étape 1

Instancier le HBaseAdmin classe.

// Instantiating configuration object
Configuration conf = HBaseConfiguration.create();

// Instantiating HBaseAdmin class
HBaseAdmin admin = new HBaseAdmin(conf);

Étape 2

le addColumn() nécessite un nom de table et un objet de HColumnDescriptorclasse. Par conséquent instanciez leHColumnDescriptorclasse. Le constructeur deHColumnDescriptorà son tour, un nom de famille de colonne doit être ajouté. Ici, nous ajoutons une famille de colonnes nommée «contactDetails» à la table «employé» existante.

// Instantiating columnDescriptor object

HColumnDescriptor columnDescriptor = new
HColumnDescriptor("contactDetails");

Étape 3

Ajoutez la famille de colonnes à l'aide de addColumnméthode. Passez le nom de la table et leHColumnDescriptor objet de classe comme paramètres de cette méthode.

// Adding column family
admin.addColumn("employee", new HColumnDescriptor("columnDescriptor"));

Vous trouverez ci-dessous le programme complet pour ajouter une famille de colonnes à une table existante.

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.HColumnDescriptor;
import org.apache.hadoop.hbase.MasterNotRunningException;
import org.apache.hadoop.hbase.client.HBaseAdmin;

public class AddColoumn{

   public static void main(String args[]) throws MasterNotRunningException, IOException{

      // Instantiating configuration class.
      Configuration conf = HBaseConfiguration.create();

      // Instantiating HBaseAdmin class.
      HBaseAdmin admin = new HBaseAdmin(conf);

      // Instantiating columnDescriptor class
      HColumnDescriptor columnDescriptor = new HColumnDescriptor("contactDetails");
      
      // Adding column family
      admin.addColumn("employee", columnDescriptor);
      System.out.println("coloumn added");
   }
}

Compilez et exécutez le programme ci-dessus comme indiqué ci-dessous.

$javac AddColumn.java
$java AddColumn

La compilation ci-dessus ne fonctionne que si vous avez défini le chemin de classe dans " .bashrc». Si ce n'est pas le cas, suivez la procédure ci-dessous pour compiler votre fichier .java.

//if "/home/home/hadoop/hbase " is your Hbase home folder then.

$javac -cp /home/hadoop/hbase/lib/*: Demo.java

Si tout se passe bien, il produira la sortie suivante:

column added

Suppression d'une famille de colonnes à l'aide de l'API Java

Vous pouvez supprimer une famille de colonnes d'une table à l'aide de la méthode deleteColumn() de HBAseAdminclasse. Suivez les étapes ci-dessous pour ajouter une famille de colonnes à un tableau.

Étape 1

Instancier le HBaseAdmin classe.

// Instantiating configuration object
Configuration conf = HBaseConfiguration.create();

// Instantiating HBaseAdmin class
HBaseAdmin admin = new HBaseAdmin(conf);

Étape 2

Ajoutez la famille de colonnes à l'aide de deleteColumn()méthode. Transmettez le nom de la table et le nom de la famille de colonnes comme paramètres à cette méthode.

// Deleting column family
admin.deleteColumn("employee", "contactDetails");

Vous trouverez ci-dessous le programme complet pour supprimer une famille de colonnes d'une table existante.

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.MasterNotRunningException;
import org.apache.hadoop.hbase.client.HBaseAdmin;

public class DeleteColoumn{

   public static void main(String args[]) throws MasterNotRunningException, IOException{

      // Instantiating configuration class.
      Configuration conf = HBaseConfiguration.create();

      // Instantiating HBaseAdmin class.
      HBaseAdmin admin = new HBaseAdmin(conf);

      // Deleting a column family
      admin.deleteColumn("employee","contactDetails");
      System.out.println("coloumn deleted"); 
   }
}

Compilez et exécutez le programme ci-dessus comme indiqué ci-dessous.

$javac DeleteColumn.java
$java DeleteColumn

Ce qui suit devrait être la sortie:

column deleted