Apache NiFi - Processeurs

Les processeurs Apache NiFi sont les blocs de base pour créer un flux de données. Chaque processeur a des fonctionnalités différentes, ce qui contribue à la création d'un fichier de flux de sortie. Le flux de données illustré dans l'image ci-dessous extrait le fichier d'un répertoire à l'aide du processeur GetFile et le stocke dans un autre répertoire à l'aide du processeur PutFile.

GetFile

Le processus GetFile est utilisé pour récupérer des fichiers d'un format spécifique à partir d'un répertoire spécifique. Il fournit également d'autres options à l'utilisateur pour plus de contrôle sur la récupération. Nous en discuterons dans la section des propriétés ci-dessous.

Paramètres GetFile

Voici les différents paramètres du processeur GetFile -

Nom

Dans le paramètre Nom, un utilisateur peut définir n'importe quel nom pour les processeurs en fonction du projet ou par lui, ce qui rend le nom plus significatif.

Activer

Un utilisateur peut activer ou désactiver le processeur à l'aide de ce paramètre.

Durée de la pénalité

Ce paramètre permet à un utilisateur d'ajouter la durée du temps de pénalité, en cas d'échec du fichier de flux.

Durée du rendement

Ce paramètre est utilisé pour spécifier le temps de rendement du processeur. Pendant cette durée, le processus n'est pas de nouveau planifié.

Niveau du bulletin

Ce paramètre est utilisé pour spécifier le niveau de journalisation de ce processeur.

Mettre fin automatiquement aux relations

Cela a une liste de vérification de toutes les relations disponibles de ce processus particulier. En cochant les cases, un utilisateur peut programmer le processeur pour terminer le fichier de flux sur cet événement et ne pas l'envoyer plus loin dans le flux.

Planification GetFile

Voici les options de planification suivantes offertes par le processeur GetFile -

Stratégie de planification

Vous pouvez planifier le processus en fonction du temps en sélectionnant piloté par le temps ou une chaîne CRON spécifiée en sélectionnant une option de pilote CRON.

Tâches simultanées

Cette option est utilisée pour définir la planification des tâches simultanées pour ce processeur.

Exécution

Un utilisateur peut définir s'il doit exécuter le processeur dans tous les nœuds ou uniquement dans le nœud principal à l'aide de cette option.

Calendrier d'exécution

Il est utilisé pour définir le temps pour la stratégie pilotée par le temps ou l'expression CRON pour la stratégie pilotée par CRON.

Propriétés GetFile

GetFile offre plusieurs propriétés comme indiqué dans l'image ci-dessous qui fait rage des propriétés obligatoires telles que le répertoire d'entrée et le filtre de fichier à des propriétés facultatives telles que le filtre de chemin et la taille maximale du fichier. Un utilisateur peut gérer le processus de récupération de fichiers à l'aide de ces propriétés.

Commentaires GetFile

Cette section est utilisée pour spécifier toute information sur le processeur.

PutFile

Le processeur PutFile est utilisé pour stocker le fichier du flux de données vers un emplacement spécifique.

Paramètres PutFile

Le processeur PutFile a les paramètres suivants -

Nom

Dans le paramètre Nom, un utilisateur peut définir n'importe quel nom pour les processeurs en fonction du projet ou de ce qui rend le nom plus significatif.

Activer

Un utilisateur peut activer ou désactiver le processeur à l'aide de ce paramètre.

Durée de la pénalité

Ce paramètre permet à un utilisateur d'ajouter la durée du temps de pénalité, en cas d'échec du fichier de flux.

Durée du rendement

Ce paramètre est utilisé pour spécifier le temps de rendement du processeur. Pendant cette durée, le processus n'est plus programmé.

Niveau du bulletin

Ce paramètre est utilisé pour spécifier le niveau de journalisation de ce processeur.

Mettre fin automatiquement aux relations

Ce paramètre a une liste de vérification de toutes les relations disponibles de ce processus particulier. En cochant les cases, l'utilisateur peut programmer le processeur pour terminer le fichier de flux sur cet événement et ne pas l'envoyer plus loin dans le flux.

Planification PutFile

Voici les options de planification suivantes offertes par le processeur PutFile -

Stratégie de planification

Vous pouvez planifier le processus en fonction du temps en sélectionnant la minuterie ou une chaîne CRON spécifiée en sélectionnant l'option de pilote CRON. Il existe également une stratégie expérimentale Event Driven, qui déclenchera le processeur sur un événement spécifique.

Tâches simultanées

Cette option est utilisée pour définir la planification des tâches simultanées pour ce processeur.

Exécution

Un utilisateur peut définir s'il doit exécuter le processeur dans tous les nœuds ou uniquement dans le nœud principal à l'aide de cette option.

Calendrier d'exécution

Il est utilisé pour définir le temps pour la stratégie pilotée par la minuterie ou l'expression CRON pour la stratégie pilotée par CRON.

Propriétés PutFile

Le processeur PutFile fournit des propriétés telles que Directory pour spécifier le répertoire de sortie à des fins de transfert de fichiers et d'autres pour gérer le transfert comme indiqué dans l'image ci-dessous.

Commentaires PutFile

Cette section est utilisée pour spécifier toute information sur le processeur.