Hive - Fonctions intégrées

Ce chapitre explique les fonctions intégrées disponibles dans Hive. Les fonctions sont assez similaires aux fonctions SQL, à l'exception de leur utilisation.

Fonctions intégrées

Hive prend en charge les fonctions intégrées suivantes:

Type de retour Signature La description
GRAND rond (double a) Il renvoie la valeur BIGINT arrondie du double.
GRAND étage (double a) Il renvoie la valeur BIGINT maximale égale ou inférieure au double.
GRAND ceil (double a) Il renvoie la valeur BIGINT minimale égale ou supérieure au double.
double rand (), rand (graine int) Il renvoie un nombre aléatoire qui change de ligne en ligne.
chaîne concat (chaîne A, chaîne B, ...) Il renvoie la chaîne résultant de la concaténation de B après A.
chaîne substr (chaîne A, début int) Il renvoie la sous-chaîne de A à partir de la position de départ jusqu'à la fin de la chaîne A.
chaîne substr (chaîne A, début int, longueur int) Il renvoie la sous-chaîne de A à partir de la position de départ avec la longueur donnée.
chaîne supérieur (chaîne A) Il renvoie la chaîne résultant de la conversion de tous les caractères de A en majuscules.
chaîne ucase (chaîne A) Comme ci-dessus.
chaîne inférieur (chaîne A) Il renvoie la chaîne résultant de la conversion de tous les caractères de B en minuscules.
chaîne lcase (chaîne A) Comme ci-dessus.
chaîne trim (chaîne A) Il renvoie la chaîne résultant de la réduction des espaces aux deux extrémités de A.
chaîne ltrim (chaîne A) Il renvoie la chaîne résultant de la réduction des espaces depuis le début (côté gauche) de A.
chaîne rtrim (chaîne A) rtrim (string A) Il renvoie la chaîne résultant de la réduction des espaces à partir de la fin (côté droit) de A.
chaîne regexp_replace (chaîne A, chaîne B, chaîne C) Il renvoie la chaîne résultant du remplacement de toutes les sous-chaînes de B qui correspondent à la syntaxe d'expression régulière Java par C.
int taille (carte <KV>) Il renvoie le nombre d'éléments dans le type de carte.
int taille (Array <T>) Il renvoie le nombre d'éléments dans le type de tableau.
valeur de <type> cast (<expr> comme <type>) Il convertit les résultats de l'expression expr en <type>, par exemple cast ('1' as BIGINT) convertit la chaîne '1' en une représentation intégrale. Un NULL est renvoyé si la conversion échoue.
chaîne from_unixtime (int unixtime) convertir le nombre de secondes de l'époque Unix (1970-01-01 00:00:00 UTC) en une chaîne représentant l'horodatage de ce moment dans le fuseau horaire système actuel au format "1970-01-01 00:00: 00 "
chaîne to_date (chaîne d'horodatage) Il renvoie la partie date d'une chaîne d'horodatage: to_date ("1970-01-01 00:00:00") = "1970-01-01"
int année (date de chaîne) Il renvoie la partie année d'une date ou d'une chaîne d'horodatage: year ("1970-01-01 00:00:00") = 1970, year ("1970-01-01") = 1970
int mois (date de chaîne) Il renvoie la partie mois d'une date ou d'une chaîne d'horodatage: month ("1970-11-01 00:00:00") = 11, month ("1970-11-01") = 11
int jour (chaîne date) Il renvoie la partie jour d'une date ou d'une chaîne d'horodatage: day ("1970-11-01 00:00:00") = 1, day ("1970-11-01") = 1
chaîne get_json_object (chaîne json_string, chemin de chaîne) Il extrait l'objet json d'une chaîne json en fonction du chemin json spécifié et renvoie la chaîne json de l'objet json extrait. Il renvoie NULL si la chaîne json d'entrée n'est pas valide.

Exemple

Les requêtes suivantes illustrent certaines fonctions intégrées:

fonction round ()

hive> SELECT round(2.6) from temp;

Lors de l'exécution réussie de la requête, vous obtenez la réponse suivante:

3.0

fonction floor ()

hive> SELECT floor(2.6) from temp;

Lors de l'exécution réussie de la requête, vous obtenez la réponse suivante:

2.0

fonction ceil ()

hive> SELECT ceil(2.6) from temp;

Lors de l'exécution réussie de la requête, vous obtenez la réponse suivante:

3.0

Fonctions d'agrégation

Hive prend en charge les éléments intégrés suivants aggregate functions. L'utilisation de ces fonctions est identique à celle des fonctions d'agrégation SQL.

Type de retour Signature La description
GRAND count (*), count (expr), count (*) - Renvoie le nombre total de lignes extraites.
DOUBLE sum (col), sum (DISTINCT col) Il renvoie la somme des éléments du groupe ou la somme des valeurs distinctes de la colonne du groupe.
DOUBLE avg (col), avg (DISTINCT col) Il renvoie la moyenne des éléments du groupe ou la moyenne des valeurs distinctes de la colonne du groupe.
DOUBLE min (col) Il renvoie la valeur minimale de la colonne dans le groupe.
DOUBLE max (col) Il renvoie la valeur maximale de la colonne dans le groupe.