Apache NiFi - categorização de processadores
Neste capítulo, discutiremos a categorização de processos no Apache NiFi.
Processadores de ingestão de dados
Os processadores da categoria Data Ingestion são usados para ingerir dados no fluxo de dados NiFi. Esses são principalmente o ponto de partida de qualquer fluxo de dados no apache NiFi. Alguns dos processadores que pertencem a essas categorias são GetFile, GetHTTP, GetFTP, GetKAFKA, etc.
Processadores de roteamento e mediação
Os processadores de roteamento e mediação são usados para rotear os arquivos de fluxo para diferentes processadores ou fluxos de dados de acordo com as informações nos atributos ou conteúdo desses arquivos de fluxo. Esses processadores também são responsáveis por controlar os fluxos de dados NiFi. Alguns dos processadores que pertencem a esta categoria são RouteOnAttribute, RouteOnContent, ControlRate, RouteText, etc.
Processadores de acesso a banco de dados
Os processadores desta categoria Database Access são capazes de selecionar ou inserir dados ou executar e preparar outras instruções SQL do banco de dados. Esses processadores usam principalmente a configuração do controlador de pool de conexão de dados do Apache NiFi. Alguns dos processadores que pertencem a esta categoria são ExecuteSQL, PutSQL, PutDatabaseRecord, ListDatabaseTables, etc.
Processadores de extração de atributos
Os processadores de extração de atributos são responsáveis por extrair, analisar e alterar o processamento de atributos do arquivo de fluxo no fluxo de dados NiFi. Alguns dos processadores que pertencem a esta categoria são UpdateAttribute, EvaluateJSONPath, ExtractText, AttributesToJSON, etc.
Processadores de interação do sistema
Os processadores de interação do sistema são usados para executar processos ou comandos em qualquer sistema operacional. Esses processadores também executam scripts em muitos idiomas para interagir com uma variedade de sistemas. Alguns dos processadores que pertencem a esta categoria são ExecuteScript, ExecuteProcess, ExecuteGroovyScript, ExecuteStreamCommand, etc.
Processadores de transformação de dados
Os processadores que pertencem à Transformação de Dados são capazes de alterar o conteúdo dos arquivos de fluxo. Eles podem ser usados para substituir totalmente os dados de um arquivo de fluxo normalmente usado quando um usuário precisa enviar arquivo de fluxo como um corpo HTTP para invocar o processador HTTP. Alguns dos processadores que pertencem a esta categoria são ReplaceText, JoltTransformJSON, etc.
Processadores de envio de dados
Processadores de envio de dados geralmente são o processador final em um fluxo de dados. Esses processadores são responsáveis por armazenar ou enviar dados ao servidor de destino. Depois de armazenar ou enviar os dados com sucesso, esses processadores DROP o arquivo de fluxo com relacionamento de sucesso. Alguns dos processadores que pertencem a esta categoria são PutEmail, PutKafka, PutSFTP, PutFile, PutFTP, etc.
Processadores de divisão e agregação
Esses processadores são usados para dividir e mesclar o conteúdo presente em um arquivo de fluxo. Alguns dos processadores que pertencem a esta categoria são SplitText, SplitJson, SplitXml, MergeContent, SplitContent, etc.
Processadores HTTP
Esses processadores lidam com as chamadas HTTP e HTTPS. Alguns dos processadores que pertencem a esta categoria são InvokeHTTP, PostHTTP, ListenHTTP, etc.
Processadores AWS
Os processadores AWS são responsáveis pela interação com o sistema de serviços da Web da Amazon. Alguns dos processadores que pertencem a esta categoria são GetSQS, PutSNS, PutS3Object, FetchS3Object, etc.