Apache Presto - HIVE-Anschluss

Der Hive-Connector ermöglicht das Abfragen von Daten, die in einem Hive-Data-Warehouse gespeichert sind.

Voraussetzungen

  • Hadoop
  • Hive

Hoffentlich haben Sie Hadoop und Hive auf Ihrem Computer installiert. Starten Sie alle Dienste einzeln im neuen Terminal. Starten Sie dann den Hive-Metastore mit dem folgenden Befehl:

hive --service metastore

Presto verwendet den Hive-Metastore-Service, um die Details der Hive-Tabelle abzurufen.

Konfigurationseinstellungen

Erstellen Sie eine Datei “hive.properties” unter “etc/catalog”Verzeichnis. Verwenden Sie den folgenden Befehl.

$ cd etc 
$ cd catalog 
$ vi hive.properties  

connector.name = hive-cdh4 
hive.metastore.uri = thrift://localhost:9083

Nachdem Sie alle Änderungen vorgenommen haben, speichern Sie die Datei und beenden Sie das Terminal.

Datenbank erstellen

Erstellen Sie eine Datenbank in Hive mit der folgenden Abfrage:

Abfrage

hive> CREATE SCHEMA tutorials;

Nachdem die Datenbank erstellt wurde, können Sie sie mit der überprüfen “show databases” Befehl.

Tabelle erstellen

Tabelle erstellen ist eine Anweisung zum Erstellen einer Tabelle in Hive. Verwenden Sie beispielsweise die folgende Abfrage.

hive> create table author(auth_id int, auth_name varchar(50), 
topic varchar(100) STORED AS SEQUENCEFILE;

Tabelle einfügen

Die folgende Abfrage wird verwendet, um Datensätze in die Tabelle des Bienenstocks einzufügen.

hive> insert into table author values (1,’ Doug Cutting’,Hadoop),
(2,’ James Gosling’,java),(3,’ Dennis Ritchie’,C);

Starten Sie Presto CLI

Sie können Presto CLI starten, um das Hive-Speicher-Plugin mit dem folgenden Befehl zu verbinden.

$ ./presto --server localhost:8080 --catalog hive —schema tutorials;

Sie erhalten folgende Antwort.

presto:tutorials >

Listenschemata

Geben Sie den folgenden Befehl ein, um alle Schemas im Hive-Connector aufzulisten.

Abfrage

presto:tutorials > show schemas from hive;

Ergebnis

default  

tutorials

Listet Tabellen auf

Verwenden Sie die folgende Abfrage, um alle Tabellen im Schema "Tutorials" aufzulisten.

Abfrage

presto:tutorials > show tables from hive.tutorials;

Ergebnis

author

Tabelle abrufen

Die folgende Abfrage wird verwendet, um alle Datensätze aus der Tabelle des Bienenstocks abzurufen.

Abfrage

presto:tutorials > select * from hive.tutorials.author;

Ergebnis

auth_id  |   auth_name    | topic 
---------+----------------+-------- 
       1 | Doug Cutting   | Hadoop 
       2 | James Gosling  | java 
       3 | Dennis Ritchie | C