Hive-테이블 생성

이 장에서는 테이블을 만드는 방법과 테이블에 데이터를 삽입하는 방법에 대해 설명합니다. HIVE에서 테이블을 만드는 규칙은 SQL을 사용하여 테이블을 만드는 것과 매우 유사합니다.

테이블 문 만들기

테이블 만들기는 Hive에서 테이블을 만드는 데 사용되는 문입니다. 구문과 예는 다음과 같습니다.

통사론

CREATE [TEMPORARY] [EXTERNAL] TABLE [IF NOT EXISTS] [db_name.] table_name

[(col_name data_type [COMMENT col_comment], ...)]
[COMMENT table_comment]
[ROW FORMAT row_format]
[STORED AS file_format]

다음과 같은 테이블을 생성해야한다고 가정하겠습니다. employee 사용 CREATE TABLE성명서. 다음 표에는 직원 테이블의 필드와 해당 데이터 유형이 나열되어 있습니다.

Sr. 아니요 분야 명 데이터 형식
1 Eid int
2 이름
봉급 흙손
4 지정

다음 데이터는 설명, 필드 종결 자, 행 종결 자 및 저장된 파일 유형과 같은 행 형식 필드입니다.

COMMENT ‘Employee details’
FIELDS TERMINATED BY ‘\t’
LINES TERMINATED BY ‘\n’
STORED IN TEXT FILE

다음 쿼리는 employee 위의 데이터를 사용합니다.

hive> CREATE TABLE IF NOT EXISTS employee ( eid int, name String,
salary String, destination String)
COMMENT ‘Employee details’
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ‘\t’
LINES TERMINATED BY ‘\n’
STORED AS TEXTFILE;

IF NOT EXISTS 옵션을 추가하면 Hive는 테이블이 이미있는 경우 명령문을 무시합니다.

테이블이 성공적으로 생성되면 다음 응답이 표시됩니다.

OK
Time taken: 5.905 seconds
hive>

JDBC 프로그램

테이블을 생성하는 JDBC 프로그램이 예제입니다.

import java.sql.SQLException;
import java.sql.Connection;
import java.sql.ResultSet;
import java.sql.Statement;
import java.sql.DriverManager;

public class HiveCreateTable {
   private static String driverName = "org.apache.hadoop.hive.jdbc.HiveDriver";
   
   public static void main(String[] args) throws SQLException {
   
      // Register driver and create driver instance
      Class.forName(driverName);
      
      // get connection
      Connection con = DriverManager.getConnection("jdbc:hive://localhost:10000/userdb", "", "");
      
      // create statement
      Statement stmt = con.createStatement();
      
      // execute statement
      stmt.executeQuery("CREATE TABLE IF NOT EXISTS "
         +" employee ( eid int, name String, "
         +" salary String, destignation String)"
         +" COMMENT ‘Employee details’"
         +" ROW FORMAT DELIMITED"
         +" FIELDS TERMINATED BY ‘\t’"
         +" LINES TERMINATED BY ‘\n’"
         +" STORED AS TEXTFILE;");
         
      System.out.println(“ Table employee created.”);
      con.close();
   }
}

HiveCreateDb.java라는 파일에 프로그램을 저장합니다. 다음 명령은이 프로그램을 컴파일하고 실행하는 데 사용됩니다.

$ javac HiveCreateDb.java
$ java HiveCreateDb

산출

Table employee created.

데이터 문로드

일반적으로 SQL에서 테이블을 생성 한 후 Insert 문을 사용하여 데이터를 삽입 할 수 있습니다. 그러나 Hive에서는 LOAD DATA 문을 사용하여 데이터를 삽입 할 수 있습니다.

Hive에 데이터를 삽입하는 동안 대량 레코드를 저장하려면 LOAD DATA를 사용하는 것이 좋습니다. 데이터를로드하는 방법에는 두 가지가 있습니다. 하나는 로컬 파일 시스템에서 가져오고 두 번째는 Hadoop 파일 시스템에서 가져옵니다.

통사론

데이터로드 구문은 다음과 같습니다.

LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename 
[PARTITION (partcol1=val1, partcol2=val2 ...)]
  • LOCAL은 로컬 경로를 지정하는 식별자입니다. 선택 사항입니다.
  • OVERWRITE는 테이블의 데이터를 덮어 쓰는 옵션입니다.
  • PARTITION은 선택 사항입니다.

다음 데이터를 테이블에 삽입합니다. 다음과 같은 텍스트 파일입니다.sample.txt/home/user 예배 규칙서.

1201  Gopal       45000    Technical manager
1202  Manisha     45000    Proof reader
1203  Masthanvali 40000    Technical writer
1204  Kiran       40000    Hr Admin
1205  Kranthi     30000    Op Admin

다음 쿼리는 주어진 텍스트를 테이블에로드합니다.

hive> LOAD DATA LOCAL INPATH '/home/user/sample.txt'
OVERWRITE INTO TABLE employee;

다운로드에 성공하면 다음과 같은 응답이 표시됩니다.

OK
Time taken: 15.905 seconds
hive>

JDBC 프로그램

다음은 주어진 데이터를 테이블에로드하는 JDBC 프로그램입니다.

import java.sql.SQLException;
import java.sql.Connection;
import java.sql.ResultSet;
import java.sql.Statement;
import java.sql.DriverManager;

public class HiveLoadData {

   private static String driverName = "org.apache.hadoop.hive.jdbc.HiveDriver";
   
   public static void main(String[] args) throws SQLException {
   
      // Register driver and create driver instance
      Class.forName(driverName);
      
      // get connection
      Connection con = DriverManager.getConnection("jdbc:hive://localhost:10000/userdb", "", "");
      
      // create statement
      Statement stmt = con.createStatement();
      
      // execute statement
      stmt.executeQuery("LOAD DATA LOCAL INPATH '/home/user/sample.txt'" + "OVERWRITE INTO TABLE employee;");
      System.out.println("Load Data into employee successful");
      
      con.close();
   }
}

HiveLoadData.java라는 파일에 프로그램을 저장합니다. 이 프로그램을 컴파일하고 실행하려면 다음 명령을 사용하십시오.

$ javac HiveLoadData.java
$ java HiveLoadData

산출:

Load Data into employee successful