Apache NiFi - Prozessoren
Apache NiFi-Prozessoren sind die Grundbausteine für die Erstellung eines Datenflusses. Jeder Prozessor verfügt über unterschiedliche Funktionen, die zur Erstellung einer Ausgabe-Flussdatei beitragen. Der in der folgenden Abbildung gezeigte Datenfluss ruft eine Datei mit dem GetFile-Prozessor aus einem Verzeichnis ab und speichert sie mit dem PutFile-Prozessor in einem anderen Verzeichnis.
Eine Datei bekommen
Der GetFile-Prozess wird verwendet, um Dateien eines bestimmten Formats aus einem bestimmten Verzeichnis abzurufen. Es bietet dem Benutzer auch andere Optionen für mehr Kontrolle beim Abrufen. Wir werden es im Abschnitt Eigenschaften unten diskutieren.
GetFile-Einstellungen
Im Folgenden sind die verschiedenen Einstellungen des GetFile-Prozessors aufgeführt:
Name
In der Einstellung Name kann ein Benutzer einen beliebigen Namen für die Prozessoren entweder nach Projekt oder nach diesem definieren, wodurch der Name aussagekräftiger wird.
Aktivieren
Ein Benutzer kann den Prozessor mit dieser Einstellung aktivieren oder deaktivieren.
Strafdauer
Mit dieser Einstellung kann ein Benutzer die Dauer der Strafzeit für den Fall eines Flowfile-Fehlers hinzufügen.
Ertragsdauer
Diese Einstellung wird verwendet, um die Fließzeit für den Prozessor anzugeben. In dieser Zeit wird der Vorgang nicht erneut geplant.
Bulletin Level
Diese Einstellung wird verwendet, um die Protokollstufe dieses Prozessors anzugeben.
Beziehungen automatisch beenden
Hier finden Sie eine Liste mit Überprüfungen aller verfügbaren Beziehungen dieses bestimmten Prozesses. Durch Aktivieren der Kontrollkästchen kann ein Benutzer den Prozessor so programmieren, dass die Flussdatei bei diesem Ereignis beendet und nicht weiter im Fluss gesendet wird.
GetFile-Planung
Dies sind die folgenden Planungsoptionen, die vom GetFile-Prozessor angeboten werden:
Strategie planen
Sie können den Prozess entweder zeitlich planen, indem Sie zeitgesteuert auswählen, oder eine angegebene CRON-Zeichenfolge, indem Sie eine CRON-Treiberoption auswählen.
Gleichzeitige Aufgaben
Diese Option wird verwendet, um den Zeitplan für gleichzeitige Aufgaben für diesen Prozessor zu definieren.
Ausführung
Mit dieser Option kann ein Benutzer festlegen, ob der Prozessor auf allen Knoten oder nur auf dem Primärknoten ausgeführt werden soll.
Zeitplan ausführen
Es wird verwendet, um die Zeit für eine zeitgesteuerte Strategie oder den CRON-Ausdruck für eine CRON-gesteuerte Strategie zu definieren.
GetFile-Eigenschaften
GetFile bietet mehrere Eigenschaften, wie in der Abbildung unten gezeigt, und obligatorische Eigenschaften wie Eingabeverzeichnis und Dateifilter sowie optionale Eigenschaften wie Pfadfilter und Maximale Dateigröße. Ein Benutzer kann den Dateiabrufprozess mithilfe dieser Eigenschaften verwalten.
GetFile-Kommentare
In diesem Abschnitt werden Informationen zum Prozessor angegeben.
PutFile
Der PutFile-Prozessor wird verwendet, um die Datei aus dem Datenfluss an einem bestimmten Speicherort zu speichern.
PutFile-Einstellungen
Der PutFile-Prozessor hat die folgenden Einstellungen:
Name
In der Einstellung Name kann ein Benutzer einen beliebigen Namen für die Prozessoren definieren, entweder entsprechend dem Projekt oder nach dem Namen, der den Namen aussagekräftiger macht.
Aktivieren
Ein Benutzer kann den Prozessor mit dieser Einstellung aktivieren oder deaktivieren.
Strafdauer
Mit dieser Einstellung kann ein Benutzer die Dauer der Strafzeit für den Fall eines Flowfile-Fehlers hinzufügen.
Ertragsdauer
Diese Einstellung wird verwendet, um die Fließzeit für den Prozessor anzugeben. In dieser Zeit wird der Prozess nicht erneut geplant.
Bulletin Level
Diese Einstellung wird verwendet, um die Protokollstufe dieses Prozessors anzugeben.
Beziehungen automatisch beenden
Diese Einstellungen enthalten eine Liste der Überprüfungen aller verfügbaren Beziehungen dieses bestimmten Prozesses. Durch Aktivieren der Kontrollkästchen kann der Benutzer den Prozessor so programmieren, dass die Flussdatei bei diesem Ereignis beendet und nicht weiter im Fluss gesendet wird.
PutFile-Planung
Dies sind die folgenden Planungsoptionen, die vom PutFile-Prozessor angeboten werden:
Strategie planen
Sie können den Prozess auf Zeitbasis planen, indem Sie entweder einen zeitgesteuerten oder eine angegebene CRON-Zeichenfolge auswählen, indem Sie die Option CRON-Treiber auswählen. Es gibt auch eine ereignisgesteuerte experimentelle Strategie, die den Prozessor bei einem bestimmten Ereignis auslöst.
Gleichzeitige Aufgaben
Diese Option wird verwendet, um den Zeitplan für gleichzeitige Aufgaben für diesen Prozessor zu definieren.
Ausführung
Mit dieser Option kann ein Benutzer festlegen, ob der Prozessor auf allen Knoten oder nur auf dem Primärknoten ausgeführt werden soll.
Zeitplan ausführen
Es wird verwendet, um die Zeit für eine zeitgesteuerte Strategie oder den CRON-Ausdruck für eine CRON-gesteuerte Strategie zu definieren.
PutFile-Eigenschaften
Der PutFile-Prozessor bietet Eigenschaften wie "Verzeichnis", um das Ausgabeverzeichnis für die Dateiübertragung anzugeben, und andere, um die Übertragung zu verwalten, wie in der folgenden Abbildung dargestellt.
PutFile-Kommentare
In diesem Abschnitt werden Informationen zum Prozessor angegeben.