Hive - Eingebaute Funktionen
In diesem Kapitel werden die in Hive integrierten Funktionen erläutert. Die Funktionen sehen bis auf ihre Verwendung den SQL-Funktionen ziemlich ähnlich.
Eingebaute Funktionen
Hive unterstützt die folgenden integrierten Funktionen:
Rückgabetyp | Unterschrift | Beschreibung |
---|---|---|
BIGINT | rund (doppelt a) | Es gibt den gerundeten BIGINT-Wert des Double zurück. |
BIGINT | Boden (doppelt a) | Es gibt den maximalen BIGINT-Wert zurück, der gleich oder kleiner als das Doppelte ist. |
BIGINT | Decke (doppelt a) | Es gibt den minimalen BIGINT-Wert zurück, der gleich oder größer als das Doppelte ist. |
doppelt | rand (), rand (int seed) | Es wird eine Zufallszahl zurückgegeben, die sich von Zeile zu Zeile ändert. |
Zeichenfolge | concat (String A, String B, ...) | Es gibt die Zeichenfolge zurück, die sich aus der Verkettung von B nach A ergibt. |
Zeichenfolge | substr (String A, int start) | Es gibt den Teilstring von A von der Startposition bis zum Ende von String A zurück. |
Zeichenfolge | substr (Zeichenfolge A, int start, int length) | Es gibt den Teilstring von A ab der Startposition mit der angegebenen Länge zurück. |
Zeichenfolge | obere (Zeichenfolge A) | Es gibt die Zeichenfolge zurück, die sich aus der Konvertierung aller Zeichen von A in Großbuchstaben ergibt. |
Zeichenfolge | ucase (Zeichenfolge A) | Das gleiche wie oben. |
Zeichenfolge | niedriger (String A) | Es gibt die Zeichenfolge zurück, die sich aus der Konvertierung aller Zeichen von B in Kleinbuchstaben ergibt. |
Zeichenfolge | lcase (String A) | Das gleiche wie oben. |
Zeichenfolge | trimmen (String A) | Es gibt die Zeichenfolge zurück, die sich aus dem Trimmen von Leerzeichen an beiden Enden von A ergibt. |
Zeichenfolge | ltrim (String A) | Es gibt die Zeichenfolge zurück, die sich aus dem Trimmen von Leerzeichen am Anfang (linke Seite) von A ergibt. |
Zeichenfolge | rtrim (String A) | rtrim (Zeichenfolge A) Gibt die Zeichenfolge zurück, die sich aus dem Trimmen von Leerzeichen am Ende (rechte Seite) von A ergibt. |
Zeichenfolge | regexp_replace (Zeichenfolge A, Zeichenfolge B, Zeichenfolge C) | Es gibt die Zeichenfolge zurück, die sich aus dem Ersetzen aller Teilzeichenfolgen in B ergibt, die der Java-Syntax für reguläre Ausdrücke durch C entsprechen. |
int | Größe (Karte <KV>) | Es gibt die Anzahl der Elemente im Kartentyp zurück. |
int | Größe (Array <T>) | Es gibt die Anzahl der Elemente im Array-Typ zurück. |
Wert von <Typ> | cast (<Ausdruck> als <Typ>) | Es konvertiert die Ergebnisse des Ausdrucks expr in <Typ>, z. B. konvertiert cast ('1' als BIGINT) die Zeichenfolge '1' in die integrale Darstellung. Ein NULL wird zurückgegeben, wenn die Konvertierung nicht erfolgreich ist. |
Zeichenfolge | from_unixtime (int unixtime) | Konvertieren Sie die Anzahl der Sekunden aus der Unix-Epoche (1970-01-01 00:00:00 UTC) in eine Zeichenfolge, die den Zeitstempel dieses Moments in der aktuellen Systemzeitzone im Format "1970-01-01 00:00:" darstellt. 00 " |
Zeichenfolge | to_date (String-Zeitstempel) | Es gibt den Datumsteil einer Zeitstempelzeichenfolge zurück: to_date ("1970-01-01 00:00:00") = "1970-01-01" |
int | Jahr (Zeichenfolgendatum) | Es gibt den Jahresteil eines Datums oder einer Zeitstempelzeichenfolge zurück: Jahr ("1970-01-01 00:00:00") = 1970, Jahr ("1970-01-01") = 1970 |
int | Monat (Zeichenfolgendatum) | Es gibt den Monatsteil eines Datums oder einer Zeitstempelzeichenfolge zurück: month ("1970-11-01 00:00:00") = 11, month ("1970-11-01") = 11 |
int | Tag (Zeichenfolgendatum) | Es gibt den Tagesteil eines Datums oder einer Zeitstempelzeichenfolge zurück: Tag ("1970-11-01 00:00:00") = 1, Tag ("1970-11-01") = 1 |
Zeichenfolge | get_json_object (string json_string, string path) | Es extrahiert das JSON-Objekt aus einer JSON-Zeichenfolge basierend auf dem angegebenen JSON-Pfad und gibt die JSON-Zeichenfolge des extrahierten JSON-Objekts zurück. Es gibt NULL zurück, wenn die Eingabe-JSON-Zeichenfolge ungültig ist. |
Beispiel
Die folgenden Abfragen zeigen einige integrierte Funktionen:
round () Funktion
hive> SELECT round(2.6) from temp;
Bei erfolgreicher Ausführung der Abfrage wird die folgende Antwort angezeigt:
3.0
Boden () Funktion
hive> SELECT floor(2.6) from temp;
Nach erfolgreicher Ausführung der Abfrage wird die folgende Antwort angezeigt:
2.0
Ceil () Funktion
hive> SELECT ceil(2.6) from temp;
Nach erfolgreicher Ausführung der Abfrage wird die folgende Antwort angezeigt:
3.0
Aggregierte Funktionen
Hive unterstützt die folgenden integrierten Funktionen aggregate functions. Die Verwendung dieser Funktionen entspricht den SQL-Aggregatfunktionen.
Rückgabetyp | Unterschrift | Beschreibung |
---|---|---|
BIGINT | count (*), count (expr), | count (*) - Gibt die Gesamtzahl der abgerufenen Zeilen zurück. |
DOPPELT | sum (col), sum (DISTINCT col) | Es gibt die Summe der Elemente in der Gruppe oder die Summe der unterschiedlichen Werte der Spalte in der Gruppe zurück. |
DOPPELT | Durchschnitt (col), Durchschnitt (DISTINCT col) | Es gibt den Durchschnitt der Elemente in der Gruppe oder den Durchschnitt der unterschiedlichen Werte der Spalte in der Gruppe zurück. |
DOPPELT | min (col) | Es gibt den Mindestwert der Spalte in der Gruppe zurück. |
DOPPELT | max (col) | Es gibt den Maximalwert der Spalte in der Gruppe zurück. |