छत्ता - तालिका बनाएँ

यह अध्याय बताता है कि तालिका कैसे बनाई जाए और उसमें डेटा कैसे डाला जाए। HIVE में एक तालिका बनाने की परंपराएँ SQL का उपयोग करके तालिका बनाने के समान है।

टेबल स्टेटमेंट बनाएं

Create Table एक स्टेटमेंट है जिसका उपयोग Hive में टेबल बनाने के लिए किया जाता है। वाक्य रचना और उदाहरण इस प्रकार हैं:

वाक्य - विन्यास

CREATE [TEMPORARY] [EXTERNAL] TABLE [IF NOT EXISTS] [db_name.] table_name

[(col_name data_type [COMMENT col_comment], ...)]
[COMMENT table_comment]
[ROW FORMAT row_format]
[STORED AS file_format]

उदाहरण

हमें मान लेते हैं कि आपको नाम की तालिका बनाने की आवश्यकता है employee का उपयोग करते हुए CREATE TABLEबयान। निम्न तालिका कर्मचारी तालिका में फ़ील्ड और उनके डेटा प्रकार सूचीबद्ध करती है:

अनु क्रमांक कार्यक्षेत्र नाम डाटा प्रकार
1 ईद पूर्णांक
2 नाम तार
3 वेतन फ्लोट
4 पद तार

निम्न डेटा एक टिप्पणी है, पंक्ति स्वरूपित फ़ील्ड जैसे फ़ील्ड टर्मिनेटर, लाइन्स टर्मिनेटर, और संग्रहीत फ़ाइल प्रकार।

COMMENT ‘Employee details’
FIELDS TERMINATED BY ‘\t’
LINES TERMINATED BY ‘\n’
STORED IN TEXT FILE

निम्न क्वेरी नाम की तालिका बनाती है employee उपरोक्त डेटा का उपयोग करना।

hive> CREATE TABLE IF NOT EXISTS employee ( eid int, name String,
salary String, destination String)
COMMENT ‘Employee details’
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ‘\t’
LINES TERMINATED BY ‘\n’
STORED AS TEXTFILE;

यदि आप विकल्प नहीं जोड़ते हैं, तो हाइव उस स्थिति में बयान को अनदेखा कर देता है जब तालिका पहले से मौजूद है।

तालिका के सफल निर्माण पर, आपको निम्न प्रतिक्रिया देखने को मिलेगी:

OK
Time taken: 5.905 seconds
hive>

JDBC कार्यक्रम

तालिका बनाने के लिए JDBC कार्यक्रम का उदाहरण दिया गया है।

import java.sql.SQLException;
import java.sql.Connection;
import java.sql.ResultSet;
import java.sql.Statement;
import java.sql.DriverManager;

public class HiveCreateTable {
   private static String driverName = "org.apache.hadoop.hive.jdbc.HiveDriver";
   
   public static void main(String[] args) throws SQLException {
   
      // Register driver and create driver instance
      Class.forName(driverName);
      
      // get connection
      Connection con = DriverManager.getConnection("jdbc:hive://localhost:10000/userdb", "", "");
      
      // create statement
      Statement stmt = con.createStatement();
      
      // execute statement
      stmt.executeQuery("CREATE TABLE IF NOT EXISTS "
         +" employee ( eid int, name String, "
         +" salary String, destignation String)"
         +" COMMENT ‘Employee details’"
         +" ROW FORMAT DELIMITED"
         +" FIELDS TERMINATED BY ‘\t’"
         +" LINES TERMINATED BY ‘\n’"
         +" STORED AS TEXTFILE;");
         
      System.out.println(“ Table employee created.”);
      con.close();
   }
}

प्रोग्राम को HiveCreateDb.java नामक फ़ाइल में सहेजें। इस प्रोग्राम को संकलित करने और निष्पादित करने के लिए निम्न कमांड का उपयोग किया जाता है।

$ javac HiveCreateDb.java
$ java HiveCreateDb

उत्पादन

Table employee created.

डेटा स्टेटमेंट लोड करें

आमतौर पर, SQL में एक टेबल बनाने के बाद, हम इन्सर्ट स्टेटमेंट का उपयोग करके डेटा डाल सकते हैं। लेकिन Hive में, हम LOAD DATA स्टेटमेंट का उपयोग करके डेटा सम्मिलित कर सकते हैं।

हाइव में डेटा सम्मिलित करते समय, बल्क रिकॉर्ड स्टोर करने के लिए LOAD DATA का उपयोग करना बेहतर होता है। डेटा लोड करने के दो तरीके हैं: एक स्थानीय फ़ाइल सिस्टम से है और दूसरा Hadoop फ़ाइल सिस्टम से है।

वाक्य - विन्यास

लोड डेटा के लिए सिंटैक्स निम्नानुसार है:

LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename 
[PARTITION (partcol1=val1, partcol2=val2 ...)]
  • स्थानीय पथ को निर्दिष्ट करने के लिए स्थानीय पहचानकर्ता है। यह वैकल्पिक है।
  • OVERWRITE तालिका में डेटा को अधिलेखित करने के लिए वैकल्पिक है।
  • विभाजन वैकल्पिक है।

उदाहरण

हम निम्न डेटा को तालिका में सम्मिलित करेंगे। यह एक टेक्स्ट फाइल है जिसका नाम हैsample.txt में /home/user निर्देशिका।

1201  Gopal       45000    Technical manager
1202  Manisha     45000    Proof reader
1203  Masthanvali 40000    Technical writer
1204  Kiran       40000    Hr Admin
1205  Kranthi     30000    Op Admin

निम्न क्वेरी तालिका में दिए गए पाठ को लोड करती है।

hive> LOAD DATA LOCAL INPATH '/home/user/sample.txt'
OVERWRITE INTO TABLE employee;

सफल डाउनलोड पर, आपको निम्न प्रतिक्रिया देखने को मिलती है:

OK
Time taken: 15.905 seconds
hive>

JDBC कार्यक्रम

नीचे दिया गया JDBC प्रोग्राम टेबल में दिए गए डेटा को लोड करने के लिए है।

import java.sql.SQLException;
import java.sql.Connection;
import java.sql.ResultSet;
import java.sql.Statement;
import java.sql.DriverManager;

public class HiveLoadData {

   private static String driverName = "org.apache.hadoop.hive.jdbc.HiveDriver";
   
   public static void main(String[] args) throws SQLException {
   
      // Register driver and create driver instance
      Class.forName(driverName);
      
      // get connection
      Connection con = DriverManager.getConnection("jdbc:hive://localhost:10000/userdb", "", "");
      
      // create statement
      Statement stmt = con.createStatement();
      
      // execute statement
      stmt.executeQuery("LOAD DATA LOCAL INPATH '/home/user/sample.txt'" + "OVERWRITE INTO TABLE employee;");
      System.out.println("Load Data into employee successful");
      
      con.close();
   }
}

प्रोग्राम को HiveLoadData.java नामक फ़ाइल में सहेजें। इस प्रोग्राम को संकलित करने और निष्पादित करने के लिए निम्न कमांड का उपयोग करें।

$ javac HiveLoadData.java
$ java HiveLoadData

आउटपुट:

Load Data into employee successful