Apache Presto-HIVE 커넥터

Hive 커넥터를 사용하면 Hive 데이터웨어 하우스에 저장된 데이터를 쿼리 할 수 ​​있습니다.

전제 조건

  • Hadoop
  • Hive

컴퓨터에 Hadoop과 Hive를 설치했으면합니다. 새 터미널에서 모든 서비스를 하나씩 시작하십시오. 그런 다음 다음 명령을 사용하여 하이브 메타 스토어를 시작합니다.

hive --service metastore

Presto는 Hive 메타 스토어 서비스를 사용하여 하이브 테이블의 세부 정보를 가져옵니다.

구성 설정

파일 생성 “hive.properties” 아래에 “etc/catalog”예배 규칙서. 다음 명령을 사용하십시오.

$ cd etc 
$ cd catalog 
$ vi hive.properties  

connector.name = hive-cdh4 
hive.metastore.uri = thrift://localhost:9083

모든 변경을 수행 한 후 파일을 저장하고 터미널을 종료합니다.

데이터베이스 생성

다음 쿼리를 사용하여 Hive에서 데이터베이스를 만듭니다.

질문

hive> CREATE SCHEMA tutorials;

데이터베이스가 생성되면 다음을 사용하여 확인할 수 있습니다. “show databases” 명령.

테이블 생성

테이블 만들기는 Hive에서 테이블을 만드는 데 사용되는 문입니다. 예를 들어 다음 쿼리를 사용합니다.

hive> create table author(auth_id int, auth_name varchar(50), 
topic varchar(100) STORED AS SEQUENCEFILE;

표 삽입

다음 쿼리는 하이브의 테이블에 레코드를 삽입하는 데 사용됩니다.

hive> insert into table author values (1,’ Doug Cutting’,Hadoop),
(2,’ James Gosling’,java),(3,’ Dennis Ritchie’,C);

Presto CLI 시작

다음 명령을 사용하여 Presto CLI를 시작하여 Hive 스토리지 플러그인을 연결할 수 있습니다.

$ ./presto --server localhost:8080 --catalog hive —schema tutorials;

다음과 같은 응답을 받게됩니다.

presto:tutorials >

스키마 나열

Hive 커넥터의 모든 스키마를 나열하려면 다음 명령을 입력하십시오.

질문

presto:tutorials > show schemas from hive;

결과

default  

tutorials

목록 테이블

"tutorials"스키마의 모든 테이블을 나열하려면 다음 쿼리를 사용하십시오.

질문

presto:tutorials > show tables from hive.tutorials;

결과

author

테이블 가져 오기

다음 쿼리는 하이브의 테이블에서 모든 레코드를 가져 오는 데 사용됩니다.

질문

presto:tutorials > select * from hive.tutorials.author;

결과

auth_id  |   auth_name    | topic 
---------+----------------+-------- 
       1 | Doug Cutting   | Hadoop 
       2 | James Gosling  | java 
       3 | Dennis Ritchie | C