Apache NiFi - Prosesor

Prosesor Apache NiFi adalah blok dasar untuk membuat aliran data. Setiap prosesor memiliki fungsionalitas yang berbeda, yang berkontribusi pada pembuatan file aliran keluaran. Dataflow yang ditunjukkan pada gambar di bawah ini mengambil file dari satu direktori menggunakan prosesor GetFile dan menyimpannya di direktori lain menggunakan prosesor PutFile.

GetFile

Proses GetFile digunakan untuk mengambil file dengan format tertentu dari direktori tertentu. Ini juga memberikan opsi lain kepada pengguna untuk kontrol lebih pada pengambilan. Kami akan membahasnya di bagian properti di bawah ini.

Pengaturan GetFile

Berikut adalah pengaturan berbeda dari prosesor GetFile -

Nama

Dalam pengaturan Nama, pengguna dapat menentukan nama apa pun untuk prosesor menurut proyek atau dengan itu, yang membuat nama lebih bermakna.

Memungkinkan

Seorang pengguna dapat mengaktifkan atau menonaktifkan prosesor menggunakan pengaturan ini.

Durasi Penalti

Pengaturan ini memungkinkan pengguna untuk menambahkan durasi waktu penalti, jika terjadi kegagalan flowfile.

Durasi Hasil

Pengaturan ini digunakan untuk menentukan waktu produksi untuk prosesor. Dalam durasi ini, proses tidak dijadwalkan lagi.

Tingkat Buletin

Pengaturan ini digunakan untuk menentukan level log prosesor itu.

Putuskan Hubungan Secara Otomatis

Ini memiliki daftar pemeriksaan semua hubungan yang tersedia dari proses tertentu itu. Dengan mencentang kotak, pengguna dapat memprogram prosesor untuk menghentikan flowfile pada acara itu dan tidak mengirimkannya lebih jauh dalam aliran.

Penjadwalan GetFile

Ini adalah opsi penjadwalan berikut yang ditawarkan oleh prosesor GetFile -

Strategi Jadwal

Anda dapat menjadwalkan proses berdasarkan waktu dengan memilih didorong waktu atau string CRON tertentu dengan memilih opsi driver CRON.

Tugas Bersamaan

Opsi ini digunakan untuk menentukan jadwal tugas bersamaan untuk prosesor ini.

Eksekusi

Pengguna dapat menentukan apakah akan menjalankan prosesor di semua node atau hanya di node utama dengan menggunakan opsi ini.

Jalankan Jadwal

Ini digunakan untuk menentukan waktu untuk strategi yang digerakkan oleh waktu atau ekspresi CRON untuk strategi yang digerakkan oleh CRON.

Properti GetFile

GetFile menawarkan beberapa properti seperti yang ditunjukkan pada gambar di bawah properti wajib yang mengamuk seperti direktori Input dan filter file ke properti opsional seperti Filter Jalur dan Ukuran file Maksimum. Seorang pengguna dapat mengelola proses pengambilan file menggunakan properti ini.

Komentar GetFile

Bagian ini digunakan untuk menentukan informasi apapun tentang prosesor.

PutFile

Prosesor PutFile digunakan untuk menyimpan file dari aliran data ke lokasi tertentu.

Pengaturan PutFile

Prosesor PutFile memiliki pengaturan berikut -

Nama

Dalam pengaturan Nama, pengguna dapat menentukan nama apa pun untuk prosesor menurut proyek atau yang membuat nama lebih bermakna.

Memungkinkan

Seorang pengguna dapat mengaktifkan atau menonaktifkan prosesor menggunakan pengaturan ini.

Durasi Penalti

Pengaturan ini memungkinkan pengguna menambahkan durasi waktu penalti, jika terjadi kegagalan flowfile.

Durasi Hasil

Pengaturan ini digunakan untuk menentukan waktu produksi untuk prosesor. Dalam durasi ini, proses tidak dijadwalkan lagi.

Tingkat Buletin

Pengaturan ini digunakan untuk menentukan level log prosesor itu.

Putuskan Hubungan Secara Otomatis

Pengaturan ini memiliki daftar pemeriksaan semua hubungan yang tersedia dari proses tertentu itu. Dengan mencentang kotak, pengguna dapat memprogram prosesor untuk menghentikan flowfile pada acara itu dan tidak mengirimkannya lebih jauh dalam aliran.

Penjadwalan PutFile

Ini adalah opsi penjadwalan berikut yang ditawarkan oleh prosesor PutFile -

Strategi Jadwal

Anda dapat menjadwalkan proses berdasarkan waktu baik dengan memilih pengatur waktu atau string CRON yang ditentukan dengan memilih opsi driver CRON. Ada juga Strategi Eksperimental Didorong Peristiwa, yang akan memicu pemroses pada peristiwa tertentu.

Tugas Bersamaan

Opsi ini digunakan untuk menentukan jadwal tugas bersamaan untuk prosesor ini.

Eksekusi

Seorang pengguna dapat menentukan apakah akan menjalankan prosesor di semua node atau hanya di node utama dengan menggunakan opsi ini.

Jalankan Jadwal

Ini digunakan untuk menentukan waktu untuk strategi yang digerakkan oleh pengatur waktu atau ekspresi CRON untuk strategi yang digerakkan oleh CRON.

Properti PutFile

Prosesor PutFile menyediakan properti seperti Direktori untuk menentukan direktori keluaran untuk tujuan transfer file dan lainnya untuk mengelola transfer seperti yang ditunjukkan pada gambar di bawah ini.

Komentar PutFile

Bagian ini digunakan untuk menentukan informasi apapun tentang prosesor.