अपाचे ताजो - HBase के साथ एकीकरण

Apache Tajo HBase एकीकरण का समर्थन करता है। यह हमें ताजो में HBase टेबल तक पहुंचने में सक्षम बनाता है। HBase एक वितरित स्तंभ-उन्मुख डेटाबेस है, जो Hadoop फ़ाइल सिस्टम के शीर्ष पर बनाया गया है। यह Hadoop पारिस्थितिकी तंत्र का एक हिस्सा है जो Hadoop फाइल सिस्टम में डेटा को यादृच्छिक रूप से पढ़ने / लिखने की सुविधा प्रदान करता है। HBase एकीकरण को कॉन्फ़िगर करने के लिए निम्न चरणों की आवश्यकता होती है।

पर्यावरण चर सेट करें

निम्नलिखित परिवर्तनों को "conf / tajo-env.sh" फ़ाइल में जोड़ें।

$ vi conf/tajo-env.sh  
# HBase home directory. It is opitional but is required mandatorily to use HBase. 
# export HBASE_HOME = path/to/HBase

आपके द्वारा HBase पथ को शामिल किए जाने के बाद, Tajo HBase लाइब्रेरी फ़ाइल को क्लासपाथ पर सेट करेगा।

एक बाहरी तालिका बनाएँ

निम्नलिखित सिंटैक्स का उपयोग करके एक बाहरी तालिका बनाएं -

CREATE [EXTERNAL] TABLE [IF NOT EXISTS] <table_name> [(<column_name> <data_type>, ... )] 
USING hbase WITH ('table' = '<hbase_table_name>' 
, 'columns' = ':key,<column_family_name>:<qualifier_name>, ...' 
, 'hbase.zookeeper.quorum' = '<zookeeper_address>' 
, 'hbase.zookeeper.property.clientPort' = '<zookeeper_client_port>') 
[LOCATION 'hbase:zk://<hostname>:<port>/'] ;

HBase टेबल तक पहुंचने के लिए, आपको टेबलस्पेस स्थान को कॉन्फ़िगर करना होगा।

यहाँ,

  • Table- hbase मूल तालिका नाम सेट करें। यदि आप एक बाहरी तालिका बनाना चाहते हैं, तो तालिका HBase पर मौजूद होनी चाहिए।

  • Columns- कुंजी HBase पंक्ति कुंजी को संदर्भित करता है। कॉलम एंट्री की संख्या ताजो टेबल कॉलम की संख्या के बराबर होनी चाहिए।

  • hbase.zookeeper.quorum - zookeeper कोरम पता सेट करें।

  • hbase.zookeeper.property.clientPort - zookeeper क्लाइंट पोर्ट सेट करें।

Query

CREATE EXTERNAL TABLE students (rowkey text,id int,name text) 
USING hbase WITH ('table' = 'students', 'columns' = ':key,info:id,content:name') 
LOCATION 'hbase:zk://<hostname>:<port>/';

यहाँ, स्थान पथ फ़ील्ड zookeeper क्लाइंट पोर्ट id सेट करता है। यदि आप पोर्ट सेट नहीं करते हैं, तो Tajo hbase-site.xml फ़ाइल की संपत्ति को संदर्भित करेगा।

HBase में टेबल बनाएं

आप निम्न क्वेरी में दिखाए गए अनुसार "hbase शेल" कमांड का उपयोग करके HBase इंटरैक्टिव शेल शुरू कर सकते हैं।

Query

/bin/hbase shell

Result

उपरोक्त क्वेरी निम्न परिणाम उत्पन्न करेगी।

hbase(main):001:0>

क्वेरी HBase के लिए कदम

HBase को क्वेरी करने के लिए, आपको निम्न चरणों को पूरा करना चाहिए -

Step 1 "ट्यूटोरियल" तालिका बनाने के लिए HBase शेल में निम्न कमांड्स को पाइप करें।

Query

hbase(main):001:0> create ‘students’,{NAME => ’info’},{NAME => ’content’} 
put 'students', ‘row-01', 'content:name', 'Adam' 
put 'students', ‘row-01', 'info:id', '001' 
put 'students', ‘row-02', 'content:name', 'Amit' 
put 'students', ‘row-02', 'info:id', '002' 
put 'students', ‘row-03', 'content:name', 'Bob' 
put 'students', ‘row-03', 'info:id', ‘003'

Step 2 - अब, टेबल में डेटा लोड करने के लिए hbase शेल में निम्न कमांड जारी करें।

main):001:0> cat ../hbase/hbase-students.txt | bin/hbase shell

Step 3 - अब, ताज़ो खोल पर लौटें और तालिका के मेटाडेटा को देखने के लिए निम्न कमांड निष्पादित करें -

default> \d students;  

table name: default.students 
table path: 
store type: HBASE 
number of rows: unknown 
volume: 0 B 
Options: 
   'columns' = ':key,info:id,content:name' 
   'table' = 'students'  

schema: 
rowkey  TEXT 
id  INT4 
name TEXT

Step 4 - तालिका से परिणाम लाने के लिए, निम्नलिखित प्रश्न का उपयोग करें -

Query

default> select * from students

Result

उपरोक्त क्वेरी निम्न परिणाम लाएगी -

rowkey,  id,  name 
------------------------------- 
row-01,  001,  Adam 
row-02,  002,  Amit 
row-03   003,  Bob