Apache Presto - HIVE-Anschluss
Der Hive-Connector ermöglicht das Abfragen von Daten, die in einem Hive-Data-Warehouse gespeichert sind.
Voraussetzungen
- Hadoop
- Hive
Hoffentlich haben Sie Hadoop und Hive auf Ihrem Computer installiert. Starten Sie alle Dienste einzeln im neuen Terminal. Starten Sie dann den Hive-Metastore mit dem folgenden Befehl:
hive --service metastore
Presto verwendet den Hive-Metastore-Service, um die Details der Hive-Tabelle abzurufen.
Konfigurationseinstellungen
Erstellen Sie eine Datei “hive.properties” unter “etc/catalog”Verzeichnis. Verwenden Sie den folgenden Befehl.
$ cd etc
$ cd catalog
$ vi hive.properties
connector.name = hive-cdh4
hive.metastore.uri = thrift://localhost:9083
Nachdem Sie alle Änderungen vorgenommen haben, speichern Sie die Datei und beenden Sie das Terminal.
Datenbank erstellen
Erstellen Sie eine Datenbank in Hive mit der folgenden Abfrage:
Abfrage
hive> CREATE SCHEMA tutorials;
Nachdem die Datenbank erstellt wurde, können Sie sie mit der überprüfen “show databases” Befehl.
Tabelle erstellen
Tabelle erstellen ist eine Anweisung zum Erstellen einer Tabelle in Hive. Verwenden Sie beispielsweise die folgende Abfrage.
hive> create table author(auth_id int, auth_name varchar(50),
topic varchar(100) STORED AS SEQUENCEFILE;
Tabelle einfügen
Die folgende Abfrage wird verwendet, um Datensätze in die Tabelle des Bienenstocks einzufügen.
hive> insert into table author values (1,’ Doug Cutting’,Hadoop),
(2,’ James Gosling’,java),(3,’ Dennis Ritchie’,C);
Starten Sie Presto CLI
Sie können Presto CLI starten, um das Hive-Speicher-Plugin mit dem folgenden Befehl zu verbinden.
$ ./presto --server localhost:8080 --catalog hive —schema tutorials;
Sie erhalten folgende Antwort.
presto:tutorials >
Listenschemata
Geben Sie den folgenden Befehl ein, um alle Schemas im Hive-Connector aufzulisten.
Abfrage
presto:tutorials > show schemas from hive;
Ergebnis
default
tutorials
Listet Tabellen auf
Verwenden Sie die folgende Abfrage, um alle Tabellen im Schema "Tutorials" aufzulisten.
Abfrage
presto:tutorials > show tables from hive.tutorials;
Ergebnis
author
Tabelle abrufen
Die folgende Abfrage wird verwendet, um alle Datensätze aus der Tabelle des Bienenstocks abzurufen.
Abfrage
presto:tutorials > select * from hive.tutorials.author;
Ergebnis
auth_id | auth_name | topic
---------+----------------+--------
1 | Doug Cutting | Hadoop
2 | James Gosling | java
3 | Dennis Ritchie | C