Apache Presto-HIVE 커넥터
Hive 커넥터를 사용하면 Hive 데이터웨어 하우스에 저장된 데이터를 쿼리 할 수 있습니다.
전제 조건
- Hadoop
- Hive
컴퓨터에 Hadoop과 Hive를 설치했으면합니다. 새 터미널에서 모든 서비스를 하나씩 시작하십시오. 그런 다음 다음 명령을 사용하여 하이브 메타 스토어를 시작합니다.
hive --service metastore
Presto는 Hive 메타 스토어 서비스를 사용하여 하이브 테이블의 세부 정보를 가져옵니다.
구성 설정
파일 생성 “hive.properties” 아래에 “etc/catalog”예배 규칙서. 다음 명령을 사용하십시오.
$ cd etc
$ cd catalog
$ vi hive.properties
connector.name = hive-cdh4
hive.metastore.uri = thrift://localhost:9083
모든 변경을 수행 한 후 파일을 저장하고 터미널을 종료합니다.
데이터베이스 생성
다음 쿼리를 사용하여 Hive에서 데이터베이스를 만듭니다.
질문
hive> CREATE SCHEMA tutorials;
데이터베이스가 생성되면 다음을 사용하여 확인할 수 있습니다. “show databases” 명령.
테이블 생성
테이블 만들기는 Hive에서 테이블을 만드는 데 사용되는 문입니다. 예를 들어 다음 쿼리를 사용합니다.
hive> create table author(auth_id int, auth_name varchar(50),
topic varchar(100) STORED AS SEQUENCEFILE;
표 삽입
다음 쿼리는 하이브의 테이블에 레코드를 삽입하는 데 사용됩니다.
hive> insert into table author values (1,’ Doug Cutting’,Hadoop),
(2,’ James Gosling’,java),(3,’ Dennis Ritchie’,C);
Presto CLI 시작
다음 명령을 사용하여 Presto CLI를 시작하여 Hive 스토리지 플러그인을 연결할 수 있습니다.
$ ./presto --server localhost:8080 --catalog hive —schema tutorials;
다음과 같은 응답을 받게됩니다.
presto:tutorials >
스키마 나열
Hive 커넥터의 모든 스키마를 나열하려면 다음 명령을 입력하십시오.
질문
presto:tutorials > show schemas from hive;
결과
default
tutorials
목록 테이블
"tutorials"스키마의 모든 테이블을 나열하려면 다음 쿼리를 사용하십시오.
질문
presto:tutorials > show tables from hive.tutorials;
결과
author
테이블 가져 오기
다음 쿼리는 하이브의 테이블에서 모든 레코드를 가져 오는 데 사용됩니다.
질문
presto:tutorials > select * from hive.tutorials.author;
결과
auth_id | auth_name | topic
---------+----------------+--------
1 | Doug Cutting | Hadoop
2 | James Gosling | java
3 | Dennis Ritchie | C