Apache NiFi - Prosesor
Prosesor Apache NiFi adalah blok dasar untuk membuat aliran data. Setiap prosesor memiliki fungsionalitas yang berbeda, yang berkontribusi pada pembuatan file aliran keluaran. Dataflow yang ditunjukkan pada gambar di bawah ini mengambil file dari satu direktori menggunakan prosesor GetFile dan menyimpannya di direktori lain menggunakan prosesor PutFile.
GetFile
Proses GetFile digunakan untuk mengambil file dengan format tertentu dari direktori tertentu. Ini juga memberikan opsi lain kepada pengguna untuk kontrol lebih pada pengambilan. Kami akan membahasnya di bagian properti di bawah ini.
Pengaturan GetFile
Berikut adalah pengaturan berbeda dari prosesor GetFile -
Nama
Dalam pengaturan Nama, pengguna dapat menentukan nama apa pun untuk prosesor menurut proyek atau dengan itu, yang membuat nama lebih bermakna.
Memungkinkan
Seorang pengguna dapat mengaktifkan atau menonaktifkan prosesor menggunakan pengaturan ini.
Durasi Penalti
Pengaturan ini memungkinkan pengguna untuk menambahkan durasi waktu penalti, jika terjadi kegagalan flowfile.
Durasi Hasil
Pengaturan ini digunakan untuk menentukan waktu produksi untuk prosesor. Dalam durasi ini, proses tidak dijadwalkan lagi.
Tingkat Buletin
Pengaturan ini digunakan untuk menentukan level log prosesor itu.
Putuskan Hubungan Secara Otomatis
Ini memiliki daftar pemeriksaan semua hubungan yang tersedia dari proses tertentu itu. Dengan mencentang kotak, pengguna dapat memprogram prosesor untuk menghentikan flowfile pada acara itu dan tidak mengirimkannya lebih jauh dalam aliran.
Penjadwalan GetFile
Ini adalah opsi penjadwalan berikut yang ditawarkan oleh prosesor GetFile -
Strategi Jadwal
Anda dapat menjadwalkan proses berdasarkan waktu dengan memilih didorong waktu atau string CRON tertentu dengan memilih opsi driver CRON.
Tugas Bersamaan
Opsi ini digunakan untuk menentukan jadwal tugas bersamaan untuk prosesor ini.
Eksekusi
Pengguna dapat menentukan apakah akan menjalankan prosesor di semua node atau hanya di node utama dengan menggunakan opsi ini.
Jalankan Jadwal
Ini digunakan untuk menentukan waktu untuk strategi yang digerakkan oleh waktu atau ekspresi CRON untuk strategi yang digerakkan oleh CRON.
Properti GetFile
GetFile menawarkan beberapa properti seperti yang ditunjukkan pada gambar di bawah properti wajib yang mengamuk seperti direktori Input dan filter file ke properti opsional seperti Filter Jalur dan Ukuran file Maksimum. Seorang pengguna dapat mengelola proses pengambilan file menggunakan properti ini.
Komentar GetFile
Bagian ini digunakan untuk menentukan informasi apapun tentang prosesor.
PutFile
Prosesor PutFile digunakan untuk menyimpan file dari aliran data ke lokasi tertentu.
Pengaturan PutFile
Prosesor PutFile memiliki pengaturan berikut -
Nama
Dalam pengaturan Nama, pengguna dapat menentukan nama apa pun untuk prosesor menurut proyek atau yang membuat nama lebih bermakna.
Memungkinkan
Seorang pengguna dapat mengaktifkan atau menonaktifkan prosesor menggunakan pengaturan ini.
Durasi Penalti
Pengaturan ini memungkinkan pengguna menambahkan durasi waktu penalti, jika terjadi kegagalan flowfile.
Durasi Hasil
Pengaturan ini digunakan untuk menentukan waktu produksi untuk prosesor. Dalam durasi ini, proses tidak dijadwalkan lagi.
Tingkat Buletin
Pengaturan ini digunakan untuk menentukan level log prosesor itu.
Putuskan Hubungan Secara Otomatis
Pengaturan ini memiliki daftar pemeriksaan semua hubungan yang tersedia dari proses tertentu itu. Dengan mencentang kotak, pengguna dapat memprogram prosesor untuk menghentikan flowfile pada acara itu dan tidak mengirimkannya lebih jauh dalam aliran.
Penjadwalan PutFile
Ini adalah opsi penjadwalan berikut yang ditawarkan oleh prosesor PutFile -
Strategi Jadwal
Anda dapat menjadwalkan proses berdasarkan waktu baik dengan memilih pengatur waktu atau string CRON yang ditentukan dengan memilih opsi driver CRON. Ada juga Strategi Eksperimental Didorong Peristiwa, yang akan memicu pemroses pada peristiwa tertentu.
Tugas Bersamaan
Opsi ini digunakan untuk menentukan jadwal tugas bersamaan untuk prosesor ini.
Eksekusi
Seorang pengguna dapat menentukan apakah akan menjalankan prosesor di semua node atau hanya di node utama dengan menggunakan opsi ini.
Jalankan Jadwal
Ini digunakan untuk menentukan waktu untuk strategi yang digerakkan oleh pengatur waktu atau ekspresi CRON untuk strategi yang digerakkan oleh CRON.
Properti PutFile
Prosesor PutFile menyediakan properti seperti Direktori untuk menentukan direktori keluaran untuk tujuan transfer file dan lainnya untuk mengelola transfer seperti yang ditunjukkan pada gambar di bawah ini.
Komentar PutFile
Bagian ini digunakan untuk menentukan informasi apapun tentang prosesor.