Apache Pig - funções de avaliação
Apache Pig fornece várias funções integradas, nomeadamente eval, load, store, math, string, bag e tuple funções.
Funções de avaliação
Dada abaixo está a lista de eval funções fornecidas pelo Apache Pig.
SN | Descrição da função |
---|---|
1 | AVG ()
Para calcular a média dos valores numéricos dentro de uma bolsa. |
2 | BagToString ()
Para concatenar os elementos de uma bolsa em uma string. Ao concatenar, podemos colocar um delimitador entre esses valores (opcional). |
3 | CONCAT ()
Para concatenar duas ou mais expressões do mesmo tipo. |
4 | CONTAGEM()
Para obter o número de elementos em uma bolsa, enquanto conta o número de tuplas em uma bolsa. |
5 | COUNT_STAR ()
É semelhante ao COUNT()função. É usado para obter o número de elementos em uma bolsa. |
6 | DIFF ()
Para comparar dois sacos (campos) em uma tupla. |
7 | Está vazia()
Para verificar se uma bolsa ou mapa está vazio. |
8 | MAX ()
Para calcular o valor mais alto para uma coluna (valores numéricos ou chararrays) em um pacote de coluna única. |
9 | MIN ()
Para obter o valor mínimo (mais baixo) (numérico ou chararray) para uma determinada coluna em um pacote de coluna única. |
10 | PluckTuple ()
Usando o Pig Latin PluckTuple() função, podemos definir um prefixo de string e filtrar as colunas em uma relação que começa com o prefixo dado. |
11 | TAMANHO()
Para calcular o número de elementos com base em qualquer tipo de dados Pig. |
12 | SUBTRAIR()
Para subtrair dois sacos. Ele pega duas bolsas como entradas e retorna uma bolsa que contém as tuplas da primeira bolsa que não estão na segunda bolsa. |
13 | SOMA()
Para obter o total dos valores numéricos de uma coluna em um saco de coluna única. |
14 | TOKENIZE ()
Para dividir uma string (que contém um grupo de palavras) em uma única tupla e retornar uma bolsa que contém a saída da operação de divisão. |