Hive - wbudowane funkcje
W tym rozdziale opisano wbudowane funkcje dostępne w Hive. Funkcje wyglądają podobnie do funkcji SQL, z wyjątkiem ich użycia.
Wbudowane funkcje
Hive obsługuje następujące funkcje wbudowane:
Typ zwrotu | Podpis | Opis |
---|---|---|
BIGINT | okrągłe (podwójne a) | Zwraca zaokrągloną BIGINT wartość double. |
BIGINT | piętro (podwójne a) | Zwraca maksymalną wartość BIGINT, która jest równa lub mniejsza od double. |
BIGINT | Ceil (podwójne a) | Zwraca minimalną wartość BIGINT, która jest równa lub większa od double. |
podwójnie | rand (), rand (int seed) | Zwraca losową liczbę, która zmienia się z wiersza na wiersz. |
strunowy | concat (ciąg A, ciąg B, ...) | Zwraca ciąg wynikający z konkatenacji B po A. |
strunowy | substr (ciąg A, int start) | Zwraca podłańcuch A, zaczynając od pozycji początkowej do końca ciągu A. |
strunowy | substr (ciąg A, int start, int length) | Zwraca podciąg A, zaczynając od pozycji początkowej o podanej długości. |
strunowy | górna (ciąg A) | Zwraca ciąg będący wynikiem konwersji wszystkich znaków A na wielkie litery. |
strunowy | ucase (ciąg A) | Tak samo jak powyżej. |
strunowy | dolny (ciąg A) | Zwraca ciąg będący wynikiem konwersji wszystkich znaków z B na małe litery. |
strunowy | lcase (ciąg A) | Tak samo jak powyżej. |
strunowy | wykończenie (ciąg A) | Zwraca ciąg wynikający z obcięcia spacji z obu końców A. |
strunowy | ltrim (ciąg A) | Zwraca ciąg wynikający z przycinania spacji z początku (lewej strony) A. |
strunowy | rtrim (ciąg A) | rtrim (string A) Zwraca ciąg wynikający z obcięcia spacji z końca (prawej strony) A. |
strunowy | regexp_replace (ciąg A, ciąg B, ciąg C) | Zwraca ciąg wynikający z zastąpienia wszystkich podciągów w B, które pasują do składni wyrażenia regularnego Java przez C. |
int | rozmiar (Mapa <KV>) | Zwraca liczbę elementów w typie mapy. |
int | rozmiar (Array <T>) | Zwraca liczbę elementów w typie tablicy. |
wartość <typ> | cast (<expr> as <type>) | Konwertuje wyniki wyrażenia wyraż na <typ>, np. Cast („1” jako BIGINT) konwertuje ciąg „1” na reprezentację całkową. Jeśli konwersja nie powiedzie się, zwracana jest wartość NULL. |
strunowy | from_unixtime (int unixtime) | przekonwertować liczbę sekund z epoki systemu Unix (1970-01-01 00:00:00 UTC) na ciąg znaków reprezentujący znacznik czasu tego momentu w bieżącej strefie czasowej systemu w formacie „1970-01-01 00:00: 00 " |
strunowy | to_date (sygnatura czasowa ciągu) | Zwraca część daty w ciągu znacznika czasu: to_date („1970-01-01 00:00:00”) = „1970-01-01” |
int | rok (data ciągu) | Zwraca część roku z daty lub ciągu znacznika czasu: rok („1970-01-01 00:00:00”) = 1970, rok („1970-01-01”) = 1970 |
int | miesiąc (string data) | Zwraca część miesiąca z daty lub ciągu znacznika czasu: miesiąc („1970-11-01 00:00:00”) = 11, miesiąc („1970-11-01”) = 11 |
int | dzień (string data) | Zwraca część dnia z daty lub ciągu znacznika czasu: day („1970-11-01 00:00:00”) = 1, day („1970-11-01”) = 1 |
strunowy | get_json_object (string json_string, string path) | Wyodrębnia obiekt json z ciągu json na podstawie określonej ścieżki json i zwraca ciąg json wyodrębnionego obiektu json. Zwraca NULL, jeśli wejściowy ciąg json jest nieprawidłowy. |
Przykład
Poniższe zapytania pokazują niektóre funkcje wbudowane:
funkcja round ()
hive> SELECT round(2.6) from temp;
Po pomyślnym wykonaniu zapytania zobaczysz następującą odpowiedź:
3.0
floor (), funkcja
hive> SELECT floor(2.6) from temp;
Po pomyślnym wykonaniu zapytania zobaczysz następującą odpowiedź:
2.0
ceil (), funkcja
hive> SELECT ceil(2.6) from temp;
Po pomyślnym wykonaniu zapytania zobaczysz następującą odpowiedź:
3.0
Funkcje agregujące
Hive obsługuje następujące wbudowane aggregate functions. Użycie tych funkcji jest takie samo, jak funkcji agregujących SQL.
Typ zwrotu | Podpis | Opis |
---|---|---|
BIGINT | count (*), count (wyr), | count (*) - zwraca całkowitą liczbę pobranych wierszy. |
PODWÓJNIE | suma (kolumna), suma (DISTINCT kolumna) | Zwraca sumę elementów w grupie lub sumę odrębnych wartości kolumny w grupie. |
PODWÓJNIE | śr. (kol.), śr. (kol. DISTINCT) | Zwraca średnią elementów w grupie lub średnią odrębnych wartości kolumny w grupie. |
PODWÓJNIE | min (kol) | Zwraca minimalną wartość kolumny w grupie. |
PODWÓJNIE | max (kol) | Zwraca maksymalną wartość kolumny w grupie. |