HCatalog - तालिका बनाएँ

यह अध्याय बताता है कि तालिका कैसे बनाई जाए और उसमें डेटा कैसे डाला जाए। HCatalog में एक तालिका बनाने की परंपराएं हाइव का उपयोग करके तालिका बनाने के समान है।

टेबल स्टेटमेंट बनाएं

Create Table एक कथन है जिसका उपयोग HCatalog का उपयोग करके हाइव मेटास्टोर में एक तालिका बनाने के लिए किया जाता है। इसका सिंटैक्स और उदाहरण इस प्रकार है -

वाक्य - विन्यास

CREATE [TEMPORARY] [EXTERNAL] TABLE [IF NOT EXISTS] [db_name.] table_name
[(col_name data_type [COMMENT col_comment], ...)]
[COMMENT table_comment]
[ROW FORMAT row_format]
[STORED AS file_format]

उदाहरण

हमें मान लेते हैं कि आपको नाम की तालिका बनाने की आवश्यकता है employee का उपयोग करते हुए CREATE TABLEबयान। निम्न तालिका फ़ील्ड और उनके डेटा प्रकारों को सूचीबद्ध करती हैemployee तालिका -

अनु क्रमांक कार्यक्षेत्र नाम डाटा प्रकार
1 ईद पूर्णांक
2 नाम तार
3 वेतन फ्लोट
4 पद तार

निम्न डेटा समर्थित फ़ील्ड जैसे कि परिभाषित करता है Comment, पंक्ति जैसे खेतों को स्वरूपित किया Field terminator, Lines terminator, तथा Stored File type

COMMENT ‘Employee details’
FIELDS TERMINATED BY ‘\t’
LINES TERMINATED BY ‘\n’
STORED IN TEXT FILE

निम्न क्वेरी नाम की तालिका बनाती है employee उपरोक्त डेटा का उपयोग करना।

./hcat –e "CREATE TABLE IF NOT EXISTS employee ( eid int, name String, 
   salary String, destination String) \
COMMENT 'Employee details' \
ROW FORMAT DELIMITED \
FIELDS TERMINATED BY ‘\t’ \
LINES TERMINATED BY ‘\n’ \
STORED AS TEXTFILE;"

यदि आप विकल्प जोड़ते हैं IF NOT EXISTS, HCatalog बयान की अनदेखी मामले में तालिका पहले से मौजूद है।

तालिका के सफल निर्माण पर, आपको निम्न प्रतिक्रिया देखने को मिलेगी -

OK
Time taken: 5.905 seconds

लोड डेटा स्टेटमेंट

आमतौर पर, SQL में एक टेबल बनाने के बाद, हम इन्सर्ट स्टेटमेंट का उपयोग करके डेटा डाल सकते हैं। लेकिन HCatalog में, हम LOAD डेटा स्टेटमेंट का उपयोग करके डेटा डालते हैं।

HCatalog में डेटा सम्मिलित करते समय, थोक रिकॉर्ड को संग्रहीत करने के लिए LOAD DATA का उपयोग करना बेहतर होता है। डेटा लोड करने के दो तरीके हैं: एक से हैlocal file system और दूसरा है Hadoop file system

वाक्य - विन्यास

LOAD DATA का सिंटैक्स इस प्रकार है -

LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename
[PARTITION (partcol1=val1, partcol2=val2 ...)]
  • स्थानीय पथ को निर्दिष्ट करने के लिए LOCAL पहचानकर्ता है। यह वैकल्पिक है।
  • OVERWRITE तालिका में डेटा को अधिलेखित करने के लिए वैकल्पिक है।
  • विभाजन वैकल्पिक है।

उदाहरण

हम निम्न डेटा को तालिका में सम्मिलित करेंगे। यह एक टेक्स्ट फाइल है जिसका नाम हैsample.txt में /home/user निर्देशिका।

1201  Gopal        45000    Technical manager
1202  Manisha      45000    Proof reader
1203  Masthanvali  40000    Technical writer
1204  Kiran        40000    Hr Admin
1205  Kranthi      30000    Op Admin

निम्न क्वेरी तालिका में दिए गए पाठ को लोड करती है।

./hcat –e "LOAD DATA LOCAL INPATH '/home/user/sample.txt'
OVERWRITE INTO TABLE employee;"

सफल डाउनलोड पर, आपको निम्न प्रतिक्रिया देखने को मिलती है -

OK
Time taken: 15.905 seconds