अपाचे ताजो - HBase के साथ एकीकरण
Apache Tajo HBase एकीकरण का समर्थन करता है। यह हमें ताजो में HBase टेबल तक पहुंचने में सक्षम बनाता है। HBase एक वितरित स्तंभ-उन्मुख डेटाबेस है, जो Hadoop फ़ाइल सिस्टम के शीर्ष पर बनाया गया है। यह Hadoop पारिस्थितिकी तंत्र का एक हिस्सा है जो Hadoop फाइल सिस्टम में डेटा को यादृच्छिक रूप से पढ़ने / लिखने की सुविधा प्रदान करता है। HBase एकीकरण को कॉन्फ़िगर करने के लिए निम्न चरणों की आवश्यकता होती है।
पर्यावरण चर सेट करें
निम्नलिखित परिवर्तनों को "conf / tajo-env.sh" फ़ाइल में जोड़ें।
$ vi conf/tajo-env.sh
# HBase home directory. It is opitional but is required mandatorily to use HBase.
# export HBASE_HOME = path/to/HBase
आपके द्वारा HBase पथ को शामिल किए जाने के बाद, Tajo HBase लाइब्रेरी फ़ाइल को क्लासपाथ पर सेट करेगा।
एक बाहरी तालिका बनाएँ
निम्नलिखित सिंटैक्स का उपयोग करके एक बाहरी तालिका बनाएं -
CREATE [EXTERNAL] TABLE [IF NOT EXISTS] <table_name> [(<column_name> <data_type>, ... )]
USING hbase WITH ('table' = '<hbase_table_name>'
, 'columns' = ':key,<column_family_name>:<qualifier_name>, ...'
, 'hbase.zookeeper.quorum' = '<zookeeper_address>'
, 'hbase.zookeeper.property.clientPort' = '<zookeeper_client_port>')
[LOCATION 'hbase:zk://<hostname>:<port>/'] ;
HBase टेबल तक पहुंचने के लिए, आपको टेबलस्पेस स्थान को कॉन्फ़िगर करना होगा।
यहाँ,
Table- hbase मूल तालिका नाम सेट करें। यदि आप एक बाहरी तालिका बनाना चाहते हैं, तो तालिका HBase पर मौजूद होनी चाहिए।
Columns- कुंजी HBase पंक्ति कुंजी को संदर्भित करता है। कॉलम एंट्री की संख्या ताजो टेबल कॉलम की संख्या के बराबर होनी चाहिए।
hbase.zookeeper.quorum - zookeeper कोरम पता सेट करें।
hbase.zookeeper.property.clientPort - zookeeper क्लाइंट पोर्ट सेट करें।
Query
CREATE EXTERNAL TABLE students (rowkey text,id int,name text)
USING hbase WITH ('table' = 'students', 'columns' = ':key,info:id,content:name')
LOCATION 'hbase:zk://<hostname>:<port>/';
यहाँ, स्थान पथ फ़ील्ड zookeeper क्लाइंट पोर्ट id सेट करता है। यदि आप पोर्ट सेट नहीं करते हैं, तो Tajo hbase-site.xml फ़ाइल की संपत्ति को संदर्भित करेगा।
HBase में टेबल बनाएं
आप निम्न क्वेरी में दिखाए गए अनुसार "hbase शेल" कमांड का उपयोग करके HBase इंटरैक्टिव शेल शुरू कर सकते हैं।
Query
/bin/hbase shell
Result
उपरोक्त क्वेरी निम्न परिणाम उत्पन्न करेगी।
hbase(main):001:0>
क्वेरी HBase के लिए कदम
HBase को क्वेरी करने के लिए, आपको निम्न चरणों को पूरा करना चाहिए -
Step 1 "ट्यूटोरियल" तालिका बनाने के लिए HBase शेल में निम्न कमांड्स को पाइप करें।
Query
hbase(main):001:0> create ‘students’,{NAME => ’info’},{NAME => ’content’}
put 'students', ‘row-01', 'content:name', 'Adam'
put 'students', ‘row-01', 'info:id', '001'
put 'students', ‘row-02', 'content:name', 'Amit'
put 'students', ‘row-02', 'info:id', '002'
put 'students', ‘row-03', 'content:name', 'Bob'
put 'students', ‘row-03', 'info:id', ‘003'
Step 2 - अब, टेबल में डेटा लोड करने के लिए hbase शेल में निम्न कमांड जारी करें।
main):001:0> cat ../hbase/hbase-students.txt | bin/hbase shell
Step 3 - अब, ताज़ो खोल पर लौटें और तालिका के मेटाडेटा को देखने के लिए निम्न कमांड निष्पादित करें -
default> \d students;
table name: default.students
table path:
store type: HBASE
number of rows: unknown
volume: 0 B
Options:
'columns' = ':key,info:id,content:name'
'table' = 'students'
schema:
rowkey TEXT
id INT4
name TEXT
Step 4 - तालिका से परिणाम लाने के लिए, निम्नलिखित प्रश्न का उपयोग करें -
Query
default> select * from students
Result
उपरोक्त क्वेरी निम्न परिणाम लाएगी -
rowkey, id, name
-------------------------------
row-01, 001, Adam
row-02, 002, Amit
row-03 003, Bob