Apache Presto - ตัวเชื่อมต่อ HIVE

ตัวเชื่อมต่อ Hive ช่วยให้สามารถสืบค้นข้อมูลที่เก็บไว้ในคลังข้อมูล Hive

ข้อกำหนดเบื้องต้น

  • Hadoop
  • Hive

หวังว่าคุณได้ติดตั้ง Hadoop และ Hive บนเครื่องของคุณแล้ว เริ่มบริการทั้งหมดทีละรายการในเทอร์มินัลใหม่ จากนั้นเริ่มการแพร่กระจายของรังโดยใช้คำสั่งต่อไปนี้

hive --service metastore

Presto ใช้บริการ Hive metastore เพื่อรับรายละเอียดของตารางรัง

การตั้งค่าการกำหนดค่า

สร้างไฟล์ “hive.properties” ภายใต้ “etc/catalog”ไดเรกทอรี ใช้คำสั่งต่อไปนี้

$ cd etc 
$ cd catalog 
$ vi hive.properties  

connector.name = hive-cdh4 
hive.metastore.uri = thrift://localhost:9083

หลังจากทำการเปลี่ยนแปลงทั้งหมดแล้วให้บันทึกไฟล์และออกจากเทอร์มินัล

สร้างฐานข้อมูล

สร้างฐานข้อมูลใน Hive โดยใช้แบบสอบถามต่อไปนี้ -

แบบสอบถาม

hive> CREATE SCHEMA tutorials;

หลังจากสร้างฐานข้อมูลแล้วคุณสามารถตรวจสอบได้โดยใช้ไฟล์ “show databases” คำสั่ง

สร้างตาราง

Create Table คือคำสั่งที่ใช้สร้างตารางใน Hive ตัวอย่างเช่นใช้แบบสอบถามต่อไปนี้

hive> create table author(auth_id int, auth_name varchar(50), 
topic varchar(100) STORED AS SEQUENCEFILE;

แทรกตาราง

แบบสอบถามต่อไปนี้ใช้เพื่อแทรกระเบียนในตารางของกลุ่ม

hive> insert into table author values (1,’ Doug Cutting’,Hadoop),
(2,’ James Gosling’,java),(3,’ Dennis Ritchie’,C);

เริ่ม Presto CLI

คุณสามารถเริ่ม Presto CLI เพื่อเชื่อมต่อปลั๊กอินหน่วยเก็บข้อมูล Hive โดยใช้คำสั่งต่อไปนี้

$ ./presto --server localhost:8080 --catalog hive —schema tutorials;

คุณจะได้รับคำตอบดังต่อไปนี้

presto:tutorials >

รายการ Schemas

หากต้องการแสดงรายการสกีมาทั้งหมดในตัวเชื่อมต่อไฮฟ์ให้พิมพ์คำสั่งต่อไปนี้

แบบสอบถาม

presto:tutorials > show schemas from hive;

ผลลัพธ์

default  

tutorials

รายการตาราง

หากต้องการแสดงรายการตารางทั้งหมดในสคีมา "บทช่วยสอน" ให้ใช้คำค้นหาต่อไปนี้

แบบสอบถาม

presto:tutorials > show tables from hive.tutorials;

ผลลัพธ์

author

ดึงตาราง

แบบสอบถามต่อไปนี้ใช้เพื่อดึงข้อมูลทั้งหมดจากตารางของกลุ่ม

แบบสอบถาม

presto:tutorials > select * from hive.tutorials.author;

ผลลัพธ์

auth_id  |   auth_name    | topic 
---------+----------------+-------- 
       1 | Doug Cutting   | Hadoop 
       2 | James Gosling  | java 
       3 | Dennis Ritchie | C