Apache NiFi - Processori
I processori Apache NiFi sono i blocchi di base per la creazione di un flusso di dati. Ogni processore ha funzionalità diverse, che contribuiscono alla creazione del file di flusso di output. Il flusso di dati mostrato nell'immagine seguente sta recuperando il file da una directory utilizzando il processore GetFile e archiviandolo in un'altra directory utilizzando il processore PutFile.
Prendi il file
Il processo GetFile viene utilizzato per recuperare file di un formato specifico da una directory specifica. Fornisce inoltre altre opzioni all'utente per un maggiore controllo sul recupero. Ne discuteremo nella sezione delle proprietà di seguito.
Impostazioni GetFile
Di seguito sono riportate le diverse impostazioni del processore GetFile:
Nome
Nell'impostazione Nome, un utente può definire qualsiasi nome per i processori in base al progetto o in base a quello, il che rende il nome più significativo.
Abilitare
Un utente può abilitare o disabilitare il processore utilizzando questa impostazione.
Durata della penalità
Questa impostazione consente a un utente di aggiungere la durata della penalità, in caso di errore del file di flusso.
Durata del rendimento
Questa impostazione viene utilizzata per specificare il tempo di resa per il processore. In questa durata, il processo non viene pianificato di nuovo.
Livello bollettino
Questa impostazione viene utilizzata per specificare il livello di registrazione di quel processore.
Termina automaticamente le relazioni
Questo ha un elenco di controllo di tutte le relazioni disponibili di quel particolare processo. Selezionando le caselle, un utente può programmare il processore per terminare il file di flusso su quell'evento e non inviarlo ulteriormente nel flusso.
GetFile Scheduling
Queste sono le seguenti opzioni di pianificazione offerte dal processore GetFile:
Strategia di pianificazione
È possibile pianificare il processo in base al tempo selezionando il tempo o una stringa CRON specificata selezionando un'opzione del driver CRON.
Attività simultanee
Questa opzione viene utilizzata per definire la pianificazione dell'attività simultanea per questo processore.
Esecuzione
Un utente può definire se eseguire il processore in tutti i nodi o solo nel nodo primario utilizzando questa opzione.
Esegui pianificazione
Viene utilizzato per definire il tempo per la strategia basata sul tempo o l'espressione CRON per la strategia guidata dal CRON.
Proprietà GetFile
GetFile offre più proprietà, come mostrato nell'immagine sottostante, proprietà obbligatorie come la directory di input e il filtro dei file a proprietà opzionali come il filtro del percorso e la dimensione massima del file. Un utente può gestire il processo di recupero dei file utilizzando queste proprietà.
Commenti GetFile
Questa sezione viene utilizzata per specificare qualsiasi informazione sul processore.
PutFile
Il processore PutFile viene utilizzato per archiviare il file dal flusso di dati in una posizione specifica.
Impostazioni PutFile
Il processore PutFile ha le seguenti impostazioni:
Nome
Nell'impostazione Nome, un utente può definire qualsiasi nome per i processori in base al progetto o in base a quello che rende il nome più significativo.
Abilitare
Un utente può abilitare o disabilitare il processore utilizzando questa impostazione.
Durata della penalità
Questa impostazione consente a un utente di aggiungere la durata del tempo di penalità, in caso di errore del file di flusso.
Durata del rendimento
Questa impostazione viene utilizzata per specificare il tempo di resa per il processore. In questa durata, il processo non viene più pianificato.
Livello bollettino
Questa impostazione viene utilizzata per specificare il livello di registrazione di quel processore.
Termina automaticamente le relazioni
Questa impostazione ha un elenco di controllo di tutte le relazioni disponibili di quel particolare processo. Selezionando le caselle, l'utente può programmare il processore per terminare il file di flusso su quell'evento e non inviarlo ulteriormente nel flusso.
PutFile Scheduling
Queste sono le seguenti opzioni di pianificazione offerte dal processore PutFile:
Strategia di pianificazione
È possibile programmare il processo in base al tempo selezionando il timer o una stringa CRON specificata selezionando l'opzione del driver CRON. Esiste anche una strategia sperimentale basata su eventi, che attiverà il processore su un evento specifico.
Attività simultanee
Questa opzione viene utilizzata per definire la pianificazione dell'attività simultanea per questo processore.
Esecuzione
Un utente può definire se eseguire il processore in tutti i nodi o solo nel nodo primario utilizzando questa opzione.
Esegui pianificazione
Viene utilizzato per definire il tempo per la strategia basata su timer o l'espressione CRON per la strategia basata su CRON.
Proprietà PutFile
Il processore PutFile fornisce proprietà come Directory per specificare la directory di output ai fini del trasferimento di file e altre per gestire il trasferimento come mostrato nell'immagine sottostante.
Commenti PutFile
Questa sezione viene utilizzata per specificare qualsiasi informazione sul processore.