Apache NiFi - processadores
Os processadores Apache NiFi são os blocos básicos para a criação de um fluxo de dados. Cada processador possui uma funcionalidade diferente, o que contribui para a criação do arquivo de fluxo de saída. O fluxo de dados mostrado na imagem abaixo busca o arquivo de um diretório usando o processador GetFile e o armazena em outro diretório usando o processador PutFile.
GetFile
O processo GetFile é usado para buscar arquivos de um formato específico de um diretório específico. Ele também fornece outras opções ao usuário para obter mais controle sobre a busca. Vamos discutir isso na seção de propriedades abaixo.
Configurações de GetFile
A seguir estão as diferentes configurações do processador GetFile -
Nome
Na configuração Nome, um usuário pode definir qualquer nome para os processadores de acordo com o projeto ou por ele, o que torna o nome mais significativo.
Habilitar
Um usuário pode habilitar ou desabilitar o processador usando esta configuração.
Duração da Penalidade
Esta configuração permite que um usuário adicione a duração do tempo de penalidade, no caso de falha do arquivo de fluxo.
Duração do rendimento
Esta configuração é usada para especificar o tempo de rendimento do processador. Nesse período, o processo não é agendado novamente.
Nível de Boletim
Esta configuração é usada para especificar o nível de log desse processador.
Encerrar Relacionamentos Automaticamente
Ele contém uma lista de verificação de todos os relacionamentos disponíveis desse processo específico. Ao marcar as caixas, um usuário pode programar o processador para encerrar o arquivo de fluxo naquele evento e não enviá-lo mais adiante no fluxo.
Agendamento GetFile
Estas são as seguintes opções de agendamento oferecidas pelo processador GetFile -
Estratégia de cronograma
Você pode agendar o processo com base no tempo, selecionando controlado pelo tempo, ou uma string CRON especificada, selecionando uma opção de driver CRON.
Tarefas Simultâneas
Esta opção é usada para definir a programação de tarefa simultânea para este processador.
Execução
Um usuário pode definir se deseja executar o processador em todos os nós ou apenas no nó Primário usando esta opção.
Executar cronograma
É usado para definir o tempo para a estratégia baseada no tempo ou a expressão CRON para a estratégia baseada no CRON.
Propriedades GetFile
GetFile oferece várias propriedades, conforme mostrado na imagem abaixo, variando entre propriedades obrigatórias, como diretório de entrada e filtro de arquivo, para propriedades opcionais, como Filtro de caminho e Tamanho máximo do arquivo. Um usuário pode gerenciar o processo de obtenção de arquivos usando essas propriedades.
Comentários GetFile
Esta seção é usada para especificar qualquer informação sobre o processador.
PutFile
O processador PutFile é usado para armazenar o arquivo do fluxo de dados em um local específico.
Configurações de PutFile
O processador PutFile tem as seguintes configurações -
Nome
Na configuração Nome, um usuário pode definir qualquer nome para os processadores de acordo com o projeto ou por aquilo que torna o nome mais significativo.
Habilitar
Um usuário pode habilitar ou desabilitar o processador usando esta configuração.
Duração da Penalidade
Esta configuração permite que um usuário adicione a duração do tempo de penalidade, no caso de falha do arquivo de fluxo.
Duração do rendimento
Esta configuração é usada para especificar o tempo de rendimento do processador. Nessa duração, o processo não é agendado novamente.
Nível de Boletim
Esta configuração é usada para especificar o nível de log desse processador.
Encerrar Relacionamentos Automaticamente
Esta configuração possui uma lista de verificação de todas as relações disponíveis daquele processo em particular. Ao marcar as caixas, o usuário pode programar o processador para encerrar o arquivo de fluxo naquele evento e não enviá-lo posteriormente no fluxo.
Agendamento de PutFile
Estas são as seguintes opções de agendamento oferecidas pelo processador PutFile -
Estratégia de cronograma
Você pode agendar o processo com base no tempo, selecionando acionado por cronômetro ou uma string CRON especificada, selecionando a opção de driver CRON. Existe também uma estratégia Experimental Event Driven, que acionará o processador em um evento específico.
Tarefas Simultâneas
Esta opção é usada para definir a programação de tarefa simultânea para este processador.
Execução
Um usuário pode definir se deseja executar o processador em todos os nós ou apenas no nó primário usando esta opção.
Executar cronograma
É usado para definir o tempo para estratégia orientada por cronômetro ou expressão CRON para estratégia orientada por CRON.
Propriedades PutFile
O processador PutFile fornece propriedades como Directory para especificar o diretório de saída para fins de transferência de arquivos e outros para gerenciar a transferência, conforme mostrado na imagem abaixo.
Comentários PutFile
Esta seção é usada para especificar qualquer informação sobre o processador.