HBase - Descrever e Alterar

descrever

Este comando retorna a descrição da tabela. Sua sintaxe é a seguinte:

hbase> describe 'table name'

A seguir está a saída do comando describe no emp tabela.

hbase(main):006:0> describe 'emp'
   DESCRIPTION
      ENABLED
      
'emp', {NAME ⇒ 'READONLY', DATA_BLOCK_ENCODING ⇒ 'NONE', BLOOMFILTER
⇒ 'ROW', REPLICATION_SCOPE ⇒ '0', COMPRESSION ⇒ 'NONE', VERSIONS ⇒
'1', TTL true

⇒ 'FOREVER', MIN_VERSIONS ⇒ '0', KEEP_DELETED_CELLS ⇒ 'false',
BLOCKSIZE ⇒ '65536', IN_MEMORY ⇒ 'false', BLOCKCACHE ⇒ 'true'}, {NAME
⇒ 'personal

data', DATA_BLOCK_ENCODING ⇒ 'NONE', BLOOMFILTER ⇒ 'ROW',
REPLICATION_SCOPE ⇒ '0', VERSIONS ⇒ '5', COMPRESSION ⇒ 'NONE',
MIN_VERSIONS ⇒ '0', TTL

⇒ 'FOREVER', KEEP_DELETED_CELLS ⇒ 'false', BLOCKSIZE ⇒ '65536',
IN_MEMORY ⇒ 'false', BLOCKCACHE ⇒ 'true'}, {NAME ⇒ 'professional
data', DATA_BLO

CK_ENCODING ⇒ 'NONE', BLOOMFILTER ⇒ 'ROW', REPLICATION_SCOPE ⇒ '0',
VERSIONS ⇒ '1', COMPRESSION ⇒ 'NONE', MIN_VERSIONS ⇒ '0', TTL ⇒
'FOREVER', K

EEP_DELETED_CELLS ⇒ 'false', BLOCKSIZE ⇒ '65536', IN_MEMORY ⇒
'false', BLOCKCACHE ⇒ 'true'}, {NAME ⇒ 'table_att_unset',
DATA_BLOCK_ENCODING ⇒ 'NO 

NE', BLOOMFILTER ⇒ 'ROW', REPLICATION_SCOPE ⇒ '0', COMPRESSION ⇒
'NONE', VERSIONS ⇒ '1', TTL ⇒ 'FOREVER', MIN_VERSIONS ⇒ '0',
KEEP_DELETED_CELLS

⇒ 'false', BLOCKSIZE ⇒ '6

alterar

Alter é o comando usado para fazer alterações em uma tabela existente. Usando este comando, você pode alterar o número máximo de células de um grupo de colunas, definir e excluir operadores de escopo de tabela e excluir um grupo de colunas de uma tabela.

Mudando o número máximo de células de uma família de colunas

A seguir está a sintaxe para alterar o número máximo de células de uma família de colunas.

hbase> alter 't1', NAME ⇒ 'f1', VERSIONS ⇒ 5

No exemplo a seguir, o número máximo de células é definido como 5.

hbase(main):003:0> alter 'emp', NAME ⇒ 'personal data', VERSIONS ⇒ 5
Updating all regions with the new schema...
0/1 regions updated.
1/1 regions updated.
Done.
0 row(s) in 2.3050 seconds

Operadores de escopo de tabela

Usando alter, você pode definir e remover operadores de escopo da tabela, como MAX_FILESIZE, READONLY, MEMSTORE_FLUSHSIZE, DEFERRED_LOG_FLUSH, etc.

Configurando somente leitura

A seguir é fornecida a sintaxe para tornar uma tabela somente leitura.

hbase>alter 't1', READONLY(option)

No exemplo a seguir, fizemos o emp tabela somente leitura.

hbase(main):006:0> alter 'emp', READONLY
Updating all regions with the new schema...
0/1 regions updated.
1/1 regions updated.
Done.
0 row(s) in 2.2140 seconds

Removendo Operadores de Escopo de Tabela

Também podemos remover os operadores de escopo da tabela. A seguir está a sintaxe para remover 'MAX_FILESIZE' da tabela emp.

hbase> alter 't1', METHOD ⇒ 'table_att_unset', NAME ⇒ 'MAX_FILESIZE'

Excluindo uma Família de Colunas

Usando alter, você também pode excluir um grupo de colunas. Dada a seguir é a sintaxe para excluir um grupo de colunas usando alter.

hbase> alter ‘ table name ’, ‘delete’ ⇒ ‘ column family ’

A seguir, é fornecido um exemplo para excluir um grupo de colunas da tabela 'emp'.

Suponha que haja uma tabela chamada funcionário no HBase. Ele contém os seguintes dados:

hbase(main):006:0> scan 'employee'

   ROW                   COLUMN+CELL

row1 column = personal:city, timestamp = 1418193767, value = hyderabad

row1 column = personal:name, timestamp = 1418193806767, value = raju

row1 column = professional:designation, timestamp = 1418193767, value = manager

row1 column = professional:salary, timestamp = 1418193806767, value = 50000

1 row(s) in 0.0160 seconds

Agora vamos deletar o grupo de colunas chamado professional usando o comando alter.

hbase(main):007:0> alter 'employee','delete'⇒'professional'
Updating all regions with the new schema...
0/1 regions updated.
1/1 regions updated.
Done.
0 row(s) in 2.2380 seconds

Agora verifique os dados na tabela após a alteração. Observe que a família de colunas 'profissional' não existe mais, pois nós a deletamos.

hbase(main):003:0> scan 'employee'
   ROW             COLUMN + CELL
row1 column = personal:city, timestamp = 14181936767, value = hyderabad

row1 column = personal:name, timestamp = 1418193806767, value = raju

1 row(s) in 0.0830 seconds

Adicionando uma família de colunas usando a API Java

Você pode adicionar um grupo de colunas a uma tabela usando o método addColumn() do HBAseAdminclasse. Siga as etapas fornecidas abaixo para adicionar um grupo de colunas a uma tabela.

Passo 1

Instancie o HBaseAdmin classe.

// Instantiating configuration object
Configuration conf = HBaseConfiguration.create();

// Instantiating HBaseAdmin class
HBaseAdmin admin = new HBaseAdmin(conf);

Passo 2

o addColumn() método requer um nome de tabela e um objeto de HColumnDescriptorclasse. Portanto instancie oHColumnDescriptorclasse. O construtor deHColumnDescriptorpor sua vez, requer um nome de família de coluna que deve ser adicionado. Aqui, estamos adicionando um grupo de colunas denominado “contactDetails” à tabela “funcionário” existente.

// Instantiating columnDescriptor object

HColumnDescriptor columnDescriptor = new
HColumnDescriptor("contactDetails");

etapa 3

Adicione a família de colunas usando addColumnmétodo. Passe o nome da mesa e oHColumnDescriptor objeto de classe como parâmetros para este método.

// Adding column family
admin.addColumn("employee", new HColumnDescriptor("columnDescriptor"));

A seguir está o programa completo para adicionar um grupo de colunas a uma tabela existente.

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.HColumnDescriptor;
import org.apache.hadoop.hbase.MasterNotRunningException;
import org.apache.hadoop.hbase.client.HBaseAdmin;

public class AddColoumn{

   public static void main(String args[]) throws MasterNotRunningException, IOException{

      // Instantiating configuration class.
      Configuration conf = HBaseConfiguration.create();

      // Instantiating HBaseAdmin class.
      HBaseAdmin admin = new HBaseAdmin(conf);

      // Instantiating columnDescriptor class
      HColumnDescriptor columnDescriptor = new HColumnDescriptor("contactDetails");
      
      // Adding column family
      admin.addColumn("employee", columnDescriptor);
      System.out.println("coloumn added");
   }
}

Compile e execute o programa acima conforme mostrado abaixo.

$javac AddColumn.java
$java AddColumn

A compilação acima funciona apenas se você tiver definido o classpath em “ .bashrc”. Caso contrário, siga o procedimento fornecido a seguir para compilar seu arquivo .java.

//if "/home/home/hadoop/hbase " is your Hbase home folder then.

$javac -cp /home/hadoop/hbase/lib/*: Demo.java

Se tudo correr bem, ele produzirá o seguinte resultado:

column added

Excluindo uma família de colunas usando a API Java

Você pode excluir um grupo de colunas de uma tabela usando o método deleteColumn() do HBAseAdminclasse. Siga as etapas fornecidas abaixo para adicionar um grupo de colunas a uma tabela.

Passo 1

Instancie o HBaseAdmin classe.

// Instantiating configuration object
Configuration conf = HBaseConfiguration.create();

// Instantiating HBaseAdmin class
HBaseAdmin admin = new HBaseAdmin(conf);

Passo 2

Adicione a família de colunas usando deleteColumn()método. Passe o nome da tabela e o nome da família da coluna como parâmetros para este método.

// Deleting column family
admin.deleteColumn("employee", "contactDetails");

A seguir está o programa completo para excluir um grupo de colunas de uma tabela existente.

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.MasterNotRunningException;
import org.apache.hadoop.hbase.client.HBaseAdmin;

public class DeleteColoumn{

   public static void main(String args[]) throws MasterNotRunningException, IOException{

      // Instantiating configuration class.
      Configuration conf = HBaseConfiguration.create();

      // Instantiating HBaseAdmin class.
      HBaseAdmin admin = new HBaseAdmin(conf);

      // Deleting a column family
      admin.deleteColumn("employee","contactDetails");
      System.out.println("coloumn deleted"); 
   }
}

Compile e execute o programa acima conforme mostrado abaixo.

$javac DeleteColumn.java
$java DeleteColumn

O seguinte deve ser o resultado:

column deleted