ApacheNiFi-プロセッサ

Apache NiFiプロセッサは、データフローを作成するための基本的なブロックです。プロセッサごとに異なる機能があり、出力フローファイルの作成に貢献します。次の画像に示すデータフローは、GetFileプロセッサを使用して1つのディレクトリからファイルをフェッチし、PutFileプロセッサを使用して別のディレクトリに保存しています。

GetFile

GetFileプロセスは、特定のディレクトリから特定の形式のファイルをフェッチするために使用されます。また、フェッチをより細かく制御するためのその他のオプションもユーザーに提供します。これについては、以下のプロパティセクションで説明します。

GetFile設定

以下は、GetFileプロセッサのさまざまな設定です-

名前

[名前]設定では、ユーザーはプロジェクトに応じて、またはプロジェクトごとにプロセッサの任意の名前を定義できます。これにより、名前がより意味のあるものになります。

有効にする

ユーザーは、この設定を使用してプロセッサを有効または無効にできます。

ペナルティ期間

この設定により、フローファイルに障害が発生した場合に、ユーザーはペナルティ期間を追加できます。

利回りデュレーション

この設定は、プロセッサの歩留まり時間を指定するために使用されます。この期間中、プロセスは再度スケジュールされません。

速報レベル

この設定は、そのプロセッサのログレベルを指定するために使用されます。

関係を自動的に終了する

これには、その特定のプロセスで利用可能なすべての関係のチェックのリストがあります。チェックボックスをオンにすることで、ユーザーはプロセッサをプログラムして、そのイベントでフローファイルを終了し、フロー内でそれ以上送信しないようにすることができます。

GetFileスケジューリング

これらは、GetFileプロセッサによって提供される次のスケジューリングオプションです-

スケジュール戦略

時間駆動を選択して時間ベースでプロセスをスケジュールするか、CRONドライバーオプションを選択して指定したCRON文字列をスケジュールできます。

並行タスク

このオプションは、このプロセッサーの並行タスクスケジュールを定義するために使用されます。

実行

ユーザーは、このオプションを使用して、プロセッサをすべてのノードで実行するか、プライマリノードでのみ実行するかを定義できます。

実行スケジュール

これは、時間駆動型戦略の時間、またはCRON駆動型戦略のCRON式を定義するために使用されます。

GetFileプロパティ

GetFileは、下の画像に示すように、入力ディレクトリやファイルフィルターなどの強制的なプロパティから、パスフィルターや最大ファイルサイズなどのオプションのプロパティまで、複数のプロパティを提供します。ユーザーは、これらのプロパティを使用してファイルフェッチプロセスを管理できます。

GetFileコメント

このセクションは、プロセッサに関する情報を指定するために使用されます。

PutFile

PutFileプロセッサは、データフローから特定の場所にファイルを保存するために使用されます。

PutFile設定

PutFileプロセッサには次の設定があります-

名前

[名前]設定では、ユーザーは、プロジェクトに従って、または名前をより意味のあるものにする名前によって、プロセッサの任意の名前を定義できます。

有効にする

ユーザーは、この設定を使用してプロセッサを有効または無効にできます。

ペナルティ期間

この設定により、フローファイルに障害が発生した場合に、ユーザーはペナルティ期間を追加できます。

利回りデュレーション

この設定は、プロセッサの歩留まり時間を指定するために使用されます。この期間中、プロセスは再度スケジュールされません。

速報レベル

この設定は、そのプロセッサのログレベルを指定するために使用されます。

関係を自動的に終了する

この設定には、その特定のプロセスで使用可能なすべての関係のチェックのリストがあります。チェックボックスをオンにすることで、ユーザーはプロセッサをプログラムして、そのイベントでフローファイルを終了し、フロー内でそれ以上送信しないようにすることができます。

PutFileのスケジューリング

これらは、PutFileプロセッサによって提供される次のスケジューリングオプションです-

スケジュール戦略

タイマー駆動を選択するか、CRONドライバーオプションを選択して指定したCRON文字列を選択することにより、時間ベースでプロセスをスケジュールできます。特定のイベントでプロセッサをトリガーする実験戦略イベント駆動型もあります。

並行タスク

このオプションは、このプロセッサーの並行タスクスケジュールを定義するために使用されます。

実行

ユーザーは、このオプションを使用して、プロセッサをすべてのノードで実行するか、プライマリノードでのみ実行するかを定義できます。

実行スケジュール

これは、タイマー駆動型ストラテジーの時間、またはCRON駆動型ストラテジーのCRON式を定義するために使用されます。

PutFileのプロパティ

PutFileプロセッサは、次の画像に示すように、ファイル転送の目的で出力ディレクトリを指定するDirectoryや、転送を管理するその他のプロパティなどのプロパティを提供します。

PutFileコメント

このセクションは、プロセッサに関する情報を指定するために使用されます。