Apache NiFi - Panduan Cepat
Apache NiFi adalah sistem yang kuat, mudah digunakan, dan andal untuk memproses dan mendistribusikan data di antara sistem yang berbeda. Ini didasarkan pada teknologi Niagara Files yang dikembangkan oleh NSA dan kemudian setelah 8 tahun disumbangkan ke yayasan Apache Software. Ini didistribusikan di bawah Lisensi Apache Versi 2.0, Januari 2004. Versi terbaru untuk Apache NiFi adalah 1.7.1.
Apache NiFi adalah platform penyerapan data waktu nyata, yang dapat mentransfer dan mengelola transfer data antara berbagai sumber dan sistem tujuan. Mendukung berbagai macam format data seperti log, data lokasi geografis, umpan sosial, dll. Juga mendukung banyak protokol seperti SFTP, HDFS, dan KAFKA, dll. Dukungan ini untuk berbagai macam sumber data dan protokol membuat platform ini populer di banyak organisasi TI.
Apache NiFi- Fitur Umum
Fitur umum Apache NiFi adalah sebagai berikut -
Apache NiFi menyediakan antarmuka pengguna berbasis web, yang memberikan pengalaman mulus antara desain, kontrol, umpan balik, dan pemantauan.
Ini sangat dapat dikonfigurasi. Ini membantu pengguna dengan jaminan pengiriman, latensi rendah, throughput tinggi, prioritas dinamis, tekanan balik, dan modifikasi aliran pada waktu proses.
Ini juga menyediakan modul asal data untuk melacak dan memantau data dari awal hingga akhir aliran.
Pengembang dapat membuat prosesor kustom mereka sendiri dan tugas pelaporan sesuai dengan kebutuhan mereka.
NiFi juga menyediakan dukungan untuk protokol aman seperti SSL, HTTPS, SSH, dan enkripsi lainnya.
Ini juga mendukung pengguna dan manajemen peran dan juga dapat dikonfigurasi dengan LDAP untuk otorisasi.
Konsep Apache NiFi -Key
Konsep utama Apache NiFi adalah sebagai berikut -
Process Group - Ini adalah sekelompok aliran NiFi, yang membantu pengguna untuk mengelola dan menjaga aliran secara hierarkis.
Flow - Itu dibuat menghubungkan prosesor yang berbeda untuk mentransfer dan memodifikasi data jika diperlukan dari satu sumber data atau sumber ke sumber data tujuan lain.
Processor- Prosesor adalah modul java yang bertanggung jawab untuk mengambil data dari sistem sumber atau menyimpannya di sistem tujuan. Prosesor lain juga digunakan untuk menambahkan atribut atau mengubah konten di file alur.
Flowfile- Ini adalah penggunaan dasar NiFi, yang mewakili objek tunggal dari data yang diambil dari sistem sumber di NiFi. NiFiprocessormembuat perubahan ke flowfile saat berpindah dari prosesor sumber ke tujuan. Peristiwa berbeda seperti CREATE, CLONE, RECEIVE, dll. Dilakukan pada flowfile oleh prosesor yang berbeda dalam sebuah aliran.
Event- Peristiwa mewakili perubahan flowfile saat melintasi Aliran NiFi. Peristiwa ini dilacak dalam asal data.
Data provenance - Ini adalah repositori, juga memiliki UI, yang memungkinkan pengguna untuk memeriksa informasi tentang file aliran dan membantu dalam pemecahan masalah jika ada masalah yang muncul selama pemrosesan file aliran.
Keunggulan Apache NiFi
Apache NiFi memungkinkan pengambilan data dari mesin jarak jauh dengan menggunakan SFTP dan menjamin garis keturunan data.
Apache NiFi mendukung clustering, sehingga dapat bekerja pada beberapa node dengan aliran yang sama memproses data yang berbeda, yang meningkatkan kinerja pemrosesan data.
Ini juga menyediakan kebijakan keamanan pada tingkat pengguna, tingkat grup proses dan modul lainnya juga.
UI-nya juga dapat berjalan di HTTPS, yang membuat interaksi pengguna dengan NiFi aman.
NiFi mendukung sekitar 188 prosesor dan pengguna juga dapat membuat plugin khusus untuk mendukung berbagai macam sistem data.
Kekurangan Apache NiFi
Ketika node terputus dari cluster NiFi saat pengguna membuat perubahan apa pun di dalamnya, flow.xml menjadi tidak valid. Node tidak dapat terhubung kembali ke cluster kecuali admin secara manual menyalin flow.xml dari node yang terhubung.
Apache NiFi memiliki masalah persistensi status jika terjadi sakelar node utama, yang terkadang membuat prosesor tidak dapat mengambil data dari sistem sumber.
Apache NiFi terdiri dari server web, pengontrol aliran, dan prosesor, yang berjalan pada Mesin Virtual Java. Ini juga memiliki 3 repositori Flowfile Repository, Content Repository, dan Provenance Repository seperti yang ditunjukkan pada gambar di bawah ini.
Repositori Flowfile
Repositori ini menyimpan status dan atribut saat ini dari setiap flowfile yang melewati aliran data apache NiFi. Lokasi default repositori ini ada di direktori root apache NiFi. Lokasi repositori ini dapat diubah dengan mengubah properti bernama "nifi.flowfile.repository.directory".
Tempat Penyimpanan Isi
Repositori ini berisi semua konten yang ada di semua flowfile NiFi. Direktori default-nya juga ada di direktori root NiFi dan dapat diubah menggunakan properti "org.apache.nifi.controller.repository.FileSystemRepository". Direktori ini menggunakan ruang yang besar pada disk sehingga disarankan untuk memiliki cukup ruang pada disk instalasi.
Tempat Penyimpanan Asal
Repositori melacak dan menyimpan semua peristiwa dari semua file alur yang mengalir di NiFi. Ada dua repositori asalnya -volatile provenance repository (dalam repositori ini semua data asalnya hilang setelah restart) dan persistent provenance repository. Direktori defaultnya juga ada di direktori root NiFi dan dapat diubah menggunakan properti "org.apache.nifi.provenance.PersistentProvenanceRepository" dan "org.apache.nifi.provenance.VolatileProvenanceRepositor" untuk masing-masing repositori.
Pada bab ini, kita akan belajar tentang pengaturan lingkungan dari Apache NiFi. Langkah-langkah untuk instalasi Apache NiFi adalah sebagai berikut -
Step 1- Instal versi Java saat ini di komputer Anda. Harap setel JAVA_HOME di komputer Anda. Anda dapat memeriksa versi seperti yang ditunjukkan di bawah ini:
Di Sistem Operasi Windows (OS) (menggunakan command prompt) -
> java -version
Di UNIX OS (Menggunakan Terminal):
$ echo $JAVA_HOME
Step 2 - UnduhApache NiFi dari https://nifi.apache.org/download.html
Untuk Windows OS, unduh file ZIP.
Untuk UNIX OS, unduh file TAR.
Untuk gambar buruh pelabuhan, buka link berikut https://hub.docker.com/r/apache/nifi/.
Step 3- Proses instalasi Apache NiFi sangat mudah. Prosesnya berbeda dengan OS -
Windows OS - Buka zip paket zip dan Apache NiFi diinstal.
UNIX OS - Ekstrak file tar di lokasi mana pun dan Logstash diinstal.
$tar -xvf nifi-1.6.0-bin.tar.gz
Step 4- Buka command prompt, masuk ke direktori bin NiFi. Misalnya, C: \ nifi-1.7.1 \ bin, dan jalankan file run-nifi.bat.
C:\nifi-1.7.1\bin>run-nifi.bat
Step 5- Diperlukan beberapa menit untuk mengaktifkan NiFi UI. Seorang pengguna dapat memeriksa nifi-app.log, setelah NiFi UI selesai, pengguna dapat masukhttp://localhost:8080/nifi/ untuk mengakses UI.
Apache adalah platform berbasis web yang dapat diakses oleh pengguna menggunakan UI web. NiFi UI sangat interaktif dan menyediakan berbagai macam informasi tentang NiFi. Seperti yang ditunjukkan pada gambar di bawah ini, pengguna dapat mengakses informasi tentang atribut berikut -
- Benang Aktif
- Total data antrian
- Mengirimkan Grup Proses Jarak Jauh
- Tidak Mengirim Grup Proses Jarak Jauh
- Menjalankan Komponen
- Komponen yang Dihentikan
- Komponen Tidak Valid
- Komponen Dinonaktifkan
- Grup Proses Berversi terkini
- Grup Proses Berversi yang dimodifikasi secara lokal
- Grup Proses Berversi Lama
- Grup Proses Berversi Lokal dan Dimodifikasi Secara Lokal
- Kegagalan sinkronisasi Grup Proses Berversi
Komponen Apache NiFi
Apache NiFi UI memiliki komponen berikut -
Prosesor
Pengguna dapat menyeret ikon proses di kanvas dan memilih prosesor yang diinginkan untuk aliran data di NiFi.
Port masukan
Ikon di bawah ini diseret ke kanvas untuk menambahkan port input ke aliran data apa pun.
Port input digunakan untuk mendapatkan data dari prosesor, yang tidak ada dalam grup proses itu.
Setelah menyeret ikon ini, NiFi meminta untuk memasukkan nama port Input dan kemudian ditambahkan ke kanvas NiFi.
Port keluaran
Ikon di bawah ini diseret ke kanvas untuk menambahkan port output ke aliran data apa pun.
Port output digunakan untuk mentransfer data ke prosesor, yang tidak ada dalam grup proses itu.
Setelah menyeret ikon ini, NiFi meminta untuk memasukkan nama port Output dan kemudian ditambahkan ke kanvas NiFi.
Grup Proses
Seorang pengguna menggunakan ikon di bawah ini untuk menambahkan grup proses di kanvas NiFi.
Setelah menyeret ikon ini, NiFi meminta untuk memasukkan nama Grup Proses dan kemudian ditambahkan ke kanvas NiFi.
Grup Proses Jarak Jauh
Ini digunakan untuk menambahkan grup proses jarak jauh di kanvas NiFi.
Corong
Funnel digunakan untuk mentransfer keluaran dari sebuah prosesor ke beberapa prosesor. Pengguna dapat menggunakan ikon di bawah ini untuk menambahkan corong dalam aliran data NiFi.
Template
Ikon ini digunakan untuk menambahkan template aliran data ke kanvas NiFi. Ini membantu untuk menggunakan kembali aliran data dalam instans NiFi yang sama atau berbeda.
Setelah menyeret, pengguna dapat memilih templat yang sudah ditambahkan di NiFi.
Label
Ini digunakan untuk menambahkan teks pada kanvas NiFi tentang komponen apa pun yang ada di NiFi. Ini menawarkan berbagai warna yang digunakan oleh pengguna untuk menambah rasa estetika.
Prosesor Apache NiFi adalah blok dasar untuk membuat aliran data. Setiap prosesor memiliki fungsionalitas yang berbeda, yang berkontribusi pada pembuatan file aliran keluaran. Dataflow yang ditunjukkan pada gambar di bawah ini mengambil file dari satu direktori menggunakan prosesor GetFile dan menyimpannya di direktori lain menggunakan prosesor PutFile.
GetFile
Proses GetFile digunakan untuk mengambil file dengan format tertentu dari direktori tertentu. Ini juga memberikan opsi lain kepada pengguna untuk kontrol lebih pada pengambilan. Kami akan membahasnya di bagian properti di bawah ini.
Pengaturan GetFile
Berikut adalah pengaturan berbeda dari prosesor GetFile -
Nama
Dalam pengaturan Nama, pengguna dapat menentukan nama apa pun untuk prosesor menurut proyek atau dengan itu, yang membuat nama lebih bermakna.
Memungkinkan
Seorang pengguna dapat mengaktifkan atau menonaktifkan prosesor menggunakan pengaturan ini.
Durasi Penalti
Pengaturan ini memungkinkan pengguna untuk menambahkan durasi waktu penalti, jika terjadi kegagalan flowfile.
Durasi Hasil
Pengaturan ini digunakan untuk menentukan waktu produksi untuk prosesor. Dalam durasi ini, proses tidak dijadwalkan lagi.
Tingkat Buletin
Pengaturan ini digunakan untuk menentukan level log prosesor itu.
Putuskan Hubungan Secara Otomatis
Ini memiliki daftar pemeriksaan semua hubungan yang tersedia dari proses tertentu itu. Dengan mencentang kotak, pengguna dapat memprogram prosesor untuk menghentikan flowfile pada acara itu dan tidak mengirimkannya lebih jauh dalam aliran.
Penjadwalan GetFile
Ini adalah opsi penjadwalan berikut yang ditawarkan oleh prosesor GetFile -
Strategi Jadwal
Anda dapat menjadwalkan proses berdasarkan waktu dengan memilih didorong waktu atau string CRON tertentu dengan memilih opsi driver CRON.
Tugas Bersamaan
Opsi ini digunakan untuk menentukan jadwal tugas bersamaan untuk prosesor ini.
Eksekusi
Seorang pengguna dapat menentukan apakah akan menjalankan prosesor di semua node atau hanya di node utama dengan menggunakan opsi ini.
Jalankan Jadwal
Ini digunakan untuk menentukan waktu untuk strategi yang digerakkan oleh waktu atau ekspresi CRON untuk strategi yang digerakkan oleh CRON.
Properti GetFile
GetFile menawarkan beberapa properti seperti yang ditunjukkan pada gambar di bawah properti wajib yang mengamuk seperti direktori Input dan filter file ke properti opsional seperti Filter Jalur dan Ukuran file Maksimum. Seorang pengguna dapat mengelola proses pengambilan file menggunakan properti ini.
Komentar GetFile
Bagian ini digunakan untuk menentukan informasi apapun tentang prosesor.
PutFile
Prosesor PutFile digunakan untuk menyimpan file dari aliran data ke lokasi tertentu.
Pengaturan PutFile
Prosesor PutFile memiliki pengaturan berikut -
Nama
Dalam pengaturan Nama, pengguna dapat menentukan nama apa pun untuk prosesor baik menurut proyek atau dengan nama yang membuat nama lebih bermakna.
Memungkinkan
Seorang pengguna dapat mengaktifkan atau menonaktifkan prosesor menggunakan pengaturan ini.
Durasi Penalti
Pengaturan ini memungkinkan pengguna menambahkan durasi waktu penalti, jika terjadi kegagalan flowfile.
Durasi Hasil
Pengaturan ini digunakan untuk menentukan waktu produksi untuk prosesor. Dalam durasi ini, proses tidak dijadwalkan lagi.
Tingkat Buletin
Pengaturan ini digunakan untuk menentukan level log prosesor itu.
Putuskan Hubungan Secara Otomatis
Pengaturan ini memiliki daftar pemeriksaan semua hubungan yang tersedia dari proses tertentu itu. Dengan mencentang kotak, pengguna dapat memprogram prosesor untuk menghentikan flowfile pada acara itu dan tidak mengirimkannya lebih jauh dalam aliran.
Penjadwalan PutFile
Ini adalah opsi penjadwalan berikut yang ditawarkan oleh prosesor PutFile -
Strategi Jadwal
Anda dapat menjadwalkan proses berdasarkan waktu baik dengan memilih pengatur waktu atau string CRON yang ditentukan dengan memilih opsi driver CRON. Ada juga Strategi Eksperimental Didorong Peristiwa, yang akan memicu pemroses pada peristiwa tertentu.
Tugas Bersamaan
Opsi ini digunakan untuk menentukan jadwal tugas bersamaan untuk prosesor ini.
Eksekusi
Seorang pengguna dapat menentukan apakah akan menjalankan prosesor di semua node atau hanya di node utama dengan menggunakan opsi ini.
Jalankan Jadwal
Ini digunakan untuk menentukan waktu untuk strategi yang digerakkan oleh waktu atau ekspresi CRON untuk strategi yang digerakkan oleh CRON.
Properti PutFile
Prosesor PutFile menyediakan properti seperti Direktori untuk menentukan direktori keluaran untuk tujuan transfer file dan lainnya untuk mengelola transfer seperti yang ditunjukkan pada gambar di bawah ini.
Komentar PutFile
Bagian ini digunakan untuk menentukan informasi apapun tentang prosesor.
Pada bab ini, kita akan membahas kategorisasi proses di Apache NiFi.
Pemroses Penyerapan Data
Prosesor di bawah kategori Penyerapan Data digunakan untuk menyerap data ke dalam aliran data NiFi. Ini terutama merupakan titik awal dari aliran data apa pun di apache NiFi. Beberapa prosesor yang termasuk dalam kategori ini adalah GetFile, GetHTTP, GetFTP, GetKAFKA, dll.
Prosesor Perutean dan Mediasi
Prosesor perutean dan mediasi digunakan untuk merutekan file aliran ke prosesor atau aliran data yang berbeda sesuai dengan informasi dalam atribut atau konten dari file aliran tersebut. Prosesor ini juga bertanggung jawab untuk mengontrol aliran data NiFi. Beberapa prosesor yang termasuk dalam kategori ini adalah RouteOnAttribute, RouteOnContent, ControlRate, RouteText, dll.
Prosesor Akses Database
Prosesor dari kategori Access Database ini mampu memilih atau menyisipkan data atau mengeksekusi dan menyiapkan pernyataan SQL lainnya dari database. Prosesor ini terutama menggunakan pengaturan pengontrol kumpulan koneksi data dari Apache NiFi. Beberapa prosesor yang termasuk dalam kategori ini adalah ExecuteSQL, PutSQL, PutDatabaseRecord, ListDatabaseTables, dll.
Atribut Ekstraksi Prosesor
Atribut Ekstraksi Prosesor bertanggung jawab untuk mengekstrak, menganalisis, mengubah pemrosesan atribut flowfile dalam aliran data NiFi. Beberapa prosesor yang termasuk dalam kategori ini adalah UpdateAttribute, EvaluateJSONPath, ExtractText, AttributesToJSON, dll.
Prosesor Interaksi Sistem
Prosesor Interaksi Sistem digunakan untuk menjalankan proses atau perintah di sistem operasi apa pun. Prosesor ini juga menjalankan skrip dalam banyak bahasa untuk berinteraksi dengan berbagai sistem. Beberapa prosesor yang termasuk dalam kategori ini adalah ExecuteScript, ExecuteProcess, ExecuteGroovyScript, ExecuteStreamCommand, dll.
Prosesor Transformasi Data
Prosesor milik Transformasi Data mampu mengubah konten file alur. Ini dapat digunakan untuk sepenuhnya menggantikan data dari flowfile yang biasanya digunakan ketika pengguna harus mengirim flowfile sebagai badan HTTP untuk memanggil prosesor HTTP. Beberapa prosesor yang termasuk dalam kategori ini adalah ReplaceText, JoltTransformJSON, dll.
Mengirim Pemroses Data
Mengirim Pengolah Data umumnya pengolah akhir dalam aliran data. Prosesor ini bertanggung jawab untuk menyimpan atau mengirim data ke server tujuan. Setelah berhasil menyimpan atau mengirim data, prosesor ini DROP flowfile dengan hubungan sukses. Beberapa prosesor yang termasuk dalam kategori ini adalah PutEmail, PutKafka, PutSFTP, PutFile, PutFTP, dll.
Prosesor Pemisahan dan Agregasi
Prosesor ini digunakan untuk memisahkan dan menggabungkan konten yang ada di file alur. Beberapa prosesor yang termasuk dalam kategori ini adalah SplitText, SplitJson, SplitXml, MergeContent, SplitContent, dll.
Prosesor HTTP
Prosesor ini menangani panggilan HTTP dan HTTPS. Beberapa prosesor yang termasuk dalam kategori ini adalah InvokeHTTP, PostHTTP, ListenHTTP, dll.
Prosesor AWS
Prosesor AWS bertanggung jawab untuk berinteraksi dengan sistem layanan web Amazon. Beberapa prosesor yang termasuk dalam kategori ini adalah GetSQS, PutSNS, PutS3Object, FetchS3Object, dll.
Dalam aliran data Apache NiFi, file aliran berpindah dari satu prosesor ke prosesor lain melalui koneksi yang divalidasi menggunakan hubungan antar prosesor. Setiap kali koneksi dibuat, pengembang memilih satu atau beberapa hubungan antara prosesor tersebut.
Seperti yang Anda lihat pada gambar di atas, kotak centang dalam persegi panjang hitam adalah hubungan. Jika pengembang memilih kotak centang ini, maka flowfile akan berhenti di prosesor tersebut, ketika hubungan berhasil atau gagal atau keduanya.
Keberhasilan
Ketika prosesor berhasil memproses file aliran seperti menyimpan atau mengambil data dari sumber data apa pun tanpa mendapatkan koneksi, autentikasi, atau kesalahan lainnya, maka file aliran tersebut menuju hubungan sukses.
Kegagalan
Ketika prosesor tidak dapat memproses flowfile tanpa kesalahan seperti kesalahan otentikasi atau masalah koneksi, dll. Maka flowfile menuju ke hubungan yang gagal.
Pengembang juga dapat mentransfer file alur ke prosesor lain menggunakan koneksi. Pengembang dapat memilih dan juga menyeimbangkan bebannya, tetapi penyeimbangan beban baru saja dirilis di versi 1.8, yang tidak akan dibahas dalam tutorial ini.
Seperti yang Anda lihat pada gambar di atas, koneksi yang ditandai dengan warna merah memiliki hubungan kegagalan, yang berarti semua file aliran dengan kesalahan akan masuk ke prosesor di sebelah kiri dan masing-masing semua file aliran tanpa kesalahan akan ditransfer ke koneksi yang ditandai dengan warna hijau.
Sekarang mari kita lanjutkan dengan hubungan lainnya.
comms.failure
Hubungan ini terpenuhi, ketika Flowfile tidak dapat diambil dari server jarak jauh karena kegagalan komunikasi.
tidak ditemukan
Flowfile apa pun yang menerima pesan 'Not Found' dari server jarak jauh akan dipindahkan not.found hubungan.
izin ditolak
Jika NiFi tidak dapat mengambil flowfile dari server jarak jauh karena izin yang tidak memadai, NiFi akan berpindah melalui hubungan ini.
Flowfile adalah entitas pemrosesan dasar di Apache NiFi. Ini berisi konten dan atribut data, yang digunakan oleh prosesor NiFi untuk memproses data. Isi file biasanya berisi data yang diambil dari sistem sumber. Atribut paling umum dari Apache NiFi FlowFile adalah -
UUID
Ini adalah singkatan dari Universal Unique Identifier, yang merupakan identitas unik dari file alur yang dihasilkan oleh NiFi.
Nama file
Atribut ini berisi nama file dari file alur tersebut dan tidak boleh berisi struktur direktori apa pun.
Ukuran file
Ini berisi ukuran Apache NiFi FlowFile.
mime.type
Ini menentukan Jenis MIME dari FlowFile ini.
jalan
Atribut ini berisi jalur relatif dari sebuah file yang memiliki file alur dan tidak berisi nama file.
Koneksi aliran data Apache NiFi memiliki sistem antrian untuk menangani arus masuk data dalam jumlah besar. Antrean ini dapat menangani FlowFile dalam jumlah sangat besar agar prosesor dapat memprosesnya secara serial.
Antrian pada gambar di atas memiliki 1 flowfile yang ditransfer melalui hubungan sukses. Seorang pengguna dapat memeriksa flowfile dengan memilihList queueopsi di daftar drop-down. Jika terjadi kelebihan beban atau kesalahan, pengguna juga dapat menghapus antrian dengan memilihempty queue opsi dan kemudian pengguna dapat memulai kembali aliran untuk mendapatkan file tersebut lagi dalam aliran data.
Daftar flowfile dalam antrian, terdiri dari position, UUID, Filename, File size, Queue Duration, dan Lineage Duration. Seorang pengguna dapat melihat semua atribut dan konten dari file alur dengan mengklik ikon info yang ada di kolom pertama daftar file alur.
Di Apache NiFi, pengguna dapat mempertahankan aliran data yang berbeda dalam grup proses yang berbeda. Grup ini dapat didasarkan pada project atau organisasi berbeda, yang didukung oleh instance Apache NiFi.
Simbol keempat di menu di bagian atas UI NiFi seperti yang ditunjukkan pada gambar di atas digunakan untuk menambahkan grup proses di kanvas NiFi. Grup proses bernama "Tutorialspoint.com_ProcessGroup" berisi aliran data dengan empat prosesor saat ini dalam tahap berhenti seperti yang Anda lihat pada gambar di atas. Grup proses dapat dibuat secara hierarkis untuk mengelola aliran data dalam struktur yang lebih baik, yang mudah dipahami.
Di footer NiFi UI, Anda dapat melihat grup proses dan dapat kembali ke atas grup proses tempat pengguna saat ini berada.
Untuk melihat daftar lengkap grup proses yang ada di NiFi, pengguna dapat pergi ke ringkasan dengan menggunakan menu yang ada di sisi kiri atas NiFi UI. Singkatnya, ada tab grup proses di mana semua grup proses terdaftar dengan parameter seperti Status Versi, Transferred / Ukuran, Masuk / Ukuran, Baca / Tulis, Keluar / Ukuran, dll seperti yang ditunjukkan pada gambar di bawah ini.
Apache NiFi menawarkan label untuk memungkinkan pengembang menulis informasi tentang komponen yang ada di kanvas NiFI. Ikon paling kiri di menu atas NiFi UI digunakan untuk menambahkan label di kanvas NiFi.
Pengembang dapat mengubah warna label dan ukuran teks dengan klik kanan pada label dan memilih opsi yang sesuai dari menu.
Apache NiFi adalah platform yang sangat dapat dikonfigurasi. File nifi.properties di direktori conf
berisi sebagian besar konfigurasi.
Properti Apache NiFi yang umum digunakan adalah sebagai berikut -
Properti inti
Bagian ini berisi properti yang wajib untuk menjalankan instance NiFi.
S.No. | Nama properti | Nilai Default | deskripsi |
---|---|---|---|
1 | nifi.flow.configuration.file | ./conf/flow.xml.gz | Properti ini berisi jalur ke file flow.xml. File ini berisi semua aliran data yang dibuat di NiFi. |
2 | nifi.flow.configuration.archive.enabled | benar | Properti ini digunakan untuk mengaktifkan atau menonaktifkan pengarsipan di NiFi. |
3 | nifi.flow.configuration.archive.dir | ./conf/archive/ | Properti ini digunakan untuk menentukan direktori arsip. |
4 | nifi.flow.configuration.archive.max.time | 30 hari | Ini digunakan untuk menentukan waktu retensi untuk pengarsipan konten. |
5 | nifi.flow.configuration.archive.max.storage | 500 MB | itu berisi ukuran maksimum direktori pengarsipan dapat tumbuh. |
6 | nifi.authorizer.configuration.file | ./conf/authorizers.xml | Untuk menentukan file konfigurasi pengotor, yang digunakan untuk otorisasi pengguna. |
7 | nifi.login.identity.provider.configuration.file | ./conf/login-identity-providers.xml | Properti ini berisi konfigurasi penyedia identitas login, |
8 | nifi.templates.directory | ./conf/templates | Properti ini digunakan untuk menentukan direktori tempat template NiFi akan disimpan. |
9 | nifi.nar.library.directory | ./lib | Properti ini berisi jalur ke pustaka, yang akan digunakan NiFi untuk memuat semua komponen menggunakan file NAR yang ada di folder lib ini. |
10 | nifi.nar.working.directory | ./work/nar/ | Direktori ini akan menyimpan file nar yang telah dibongkar, setelah NiFi memprosesnya. |
11 | nifi.documentation.working.directory | ./work/docs/components | Direktori ini berisi dokumentasi dari semua komponen. |
Manajemen Negara
Properti ini digunakan untuk menyimpan status komponen yang berguna untuk memulai pemrosesan, di mana komponen tersisa setelah restart dan di jadwal berikutnya berjalan.
S.No. | Nama properti | Nilai Default | deskripsi |
---|---|---|---|
1 | nifi.state.management.configuration.file | ./conf/state-management.xml | Properti ini berisi jalur ke file state-management.xml. File ini berisi semua status komponen yang ada dalam aliran data dari instance NiFi tersebut. |
2 | nifi.state.management.provider.local | penyedia lokal | Ini berisi ID dari penyedia negara bagian lokal. |
3 | nifi.state.management.provider.cluster | zk-provider | Properti ini berisi ID penyedia negara bagian di seluruh cluster. Ini akan diabaikan jika NiFi tidak dikelompokkan tetapi harus diisi jika dijalankan dalam kluster. |
4 | nifi.state.management. tertanam. penjaga kebun binatang. Mulailah | Salah | Properti ini menentukan apakah instance NiFi ini harus menjalankan server ZooKeeper tertanam atau tidak. |
5 | nifi.state.management. tertanam. zookeeper.properties | ./conf/zookeeper.properties | Properti ini berisi jalur file properti yang menyediakan properti Zookeeper untuk digunakan jika <nifi.state.management. tertanam. penjaga kebun binatang. start> disetel ke true. |
Repositori FlowFile
Sekarang mari kita lihat detail penting dari gudang FlowFile -
S.No. | Nama properti | Nilai Default | deskripsi |
---|---|---|---|
1 | nifi.flowfile.repository. penerapan | org.apache.nifi. pengontrol. gudang. WriteAhead FlowFileRepository | Properti ini digunakan untuk menentukan baik untuk menyimpan file aliran dalam memori atau disk. Jika pengguna ingin menyimpan file alur dalam memori, ubah ke "org.apache.nifi.controller. Repository.VolatileFlowFileRepository". |
2 | nifi.flowfile.repository.directory | ./flowfile_repository | Untuk menentukan direktori untuk repositori flowfile. |
Apache NiFi menawarkan dukungan untuk beberapa alat seperti ambari, penjaga kebun binatang untuk keperluan administrasi. NiFi juga menyediakan konfigurasi di file nifi.properties untuk menyiapkan HTTPS dan hal-hal lain untuk administrator.
penjaga kebun binatang
NiFi sendiri tidak menangani proses voting di cluster. Artinya, saat cluster dibuat, semua node bersifat primer dan koordinator. Jadi, penjaga kebun binatang dikonfigurasikan untuk mengelola pemungutan suara simpul utama dan koordinator. File nifi.properties berisi beberapa properti untuk mengatur zookeeper.
S.No. | Nama properti | Nilai Default | deskripsi |
---|---|---|---|
1 | nifi.state.management.embedded.zookeeper. properti | ./conf/zookeeper.properties | Untuk menentukan jalur dan nama file properti penjaga kebun binatang. |
2 | nifi.zookeeper.connect.string | kosong | Untuk menentukan string koneksi penjaga kebun binatang. |
3 | nifi.zookeeper.connect.timeout | 3 detik | Untuk menentukan batas waktu koneksi dari penjaga kebun binatang dengan NiFi. |
4 | nifi.zookeeper.session.timeout | 3 detik | Untuk menentukan batas waktu sesi penjaga kebun binatang dengan NiFi. |
5 | nifi.zookeeper.root.node | / nifi | Untuk menentukan simpul akar untuk penjaga kebun binatang. |
6 | nifi.zookeeper.auth.type | kosong | Untuk menentukan jenis otentikasi untuk penjaga kebun binatang. |
Aktifkan HTTPS
Untuk menggunakan NiFi melalui HTTPS, administrator harus membuat keystore dan truststore serta menyetel beberapa properti di file nifi.properties. Toolkit TLS dapat digunakan untuk menghasilkan semua kunci yang diperlukan untuk mengaktifkan HTTPS di apache NiFi.
S.No. | Nama properti | Nilai Default | deskripsi |
---|---|---|---|
1 | nifi.web.https.port | kosong | Untuk menentukan nomor port https. |
2 | nifi.web.https.network.interface.default | kosong | Antarmuka default untuk https di NiFi. |
3 | nifi.security.keystore | kosong | Untuk menentukan jalur dan nama file keystore. |
4 | nifi.security.keystoreType | kosong | Untuk menentukan jenis jenis keystore seperti JKS. |
5 | nifi.security.keystorePasswd | kosong | Untuk menentukan kata sandi keystore. |
6 | nifi.security.truststore | kosong | Untuk menentukan jalur dan nama file truststore. |
7 | nifi.security.truststoreType | kosong | Untuk menentukan tipe tipe truststore seperti JKS. |
8 | nifi.security.truststorePasswd | kosong | Untuk menentukan kata sandi truststore. |
Properti lain untuk administrasi
Ada beberapa properti lain, yang digunakan oleh administrator untuk mengelola NiFi dan untuk kelangsungan layanannya.
S.No. | Nama properti | Nilai Default | deskripsi |
---|---|---|---|
1 | nifi.flowcontroller.graceful.shutdown.period | 10 dtk | Untuk menentukan waktu untuk mematikan flowcontroller NiFi dengan baik. |
2 | nifi.administrative.yield.duration | 30 detik | Untuk menentukan durasi hasil administratif untuk NiFi. |
3 | nifi.authorizer.configuration.file | ./conf/authorizers.xml | Untuk menentukan jalur dan nama file dari file konfigurasi pengotorisasi. |
4 | nifi.login.identity.provider.configuration.file | ./conf/login-identity-providers.xml | Untuk menentukan jalur dan nama file dari file konfigurasi penyedia identitas login. |
Apache NiFi menawarkan sejumlah besar komponen untuk membantu pengembang membuat aliran data untuk semua jenis protokol atau sumber data. Untuk membuat aliran, pengembang menyeret komponen dari bilah menu ke kanvas dan menghubungkannya dengan mengeklik dan menyeret mouse dari satu komponen ke komponen lainnya.
Umumnya, NiFi memiliki komponen pendengar di awal aliran seperti getfile, yang mendapatkan data dari sistem sumber. Di ujung lain ada komponen transmitter seperti putfile dan ada komponen di antaranya, yang memproses data.
Misalnya, mari buat aliran, yang mengambil file kosong dari satu direktori dan menambahkan beberapa teks di file itu dan meletakkannya di direktori lain.
Untuk memulai, seret ikon prosesor ke kanvas NiFi dan pilih prosesor GetFile dari daftar.
Buat direktori masukan seperti c:\inputdir.
Klik kanan pada prosesor dan pilih konfigurasi dan di tab properti tambahkan Input Directory (c:\inputdir) dan klik terapkan dan kembali ke kanvas.
Seret ikon prosesor ke kanvas dan pilih prosesor ReplaceText dari daftar.
Klik kanan pada prosesor dan pilih konfigurasi. Dalamproperties tab, tambahkan beberapa teks seperti “Hello tutorialspoint.com” di kotak teks Nilai Penggantian dan klik terapkan.
Buka tab pengaturan, centang kotak kegagalan di sisi kanan, dan kemudian kembali ke kanvas.
Hubungkan prosesor GetFIle ke ReplaceText pada hubungan sukses.
Seret ikon prosesor ke kanvas dan pilih prosesor PutFile dari daftar.
Buat direktori keluaran seperti c:\outputdir.
Klik kanan pada prosesor dan pilih konfigurasi. Di tab properti, tambahkanDirectory (c:\outputdir) dan klik terapkan dan kembali ke kanvas.
Pergi ke tab pengaturan dan centang kotak centang kegagalan dan keberhasilan di sisi kanan dan kemudian kembali ke kanvas.
Hubungkan prosesor ReplaceText ke PutFile pada hubungan sukses.
Sekarang mulai aliran dan tambahkan file kosong di direktori input dan Anda akan melihatnya, itu akan pindah ke direktori output dan teks akan ditambahkan ke file.
Dengan mengikuti langkah-langkah di atas, pengembang dapat memilih prosesor dan komponen NiFi lainnya untuk membuat aliran yang sesuai untuk organisasi atau klien mereka.
Apache NiFi menawarkan konsep Template, yang membuatnya lebih mudah untuk menggunakan kembali dan mendistribusikan aliran NiFi. Aliran dapat digunakan oleh pengembang lain atau di kluster NiFi lainnya. Ini juga membantu pengembang NiFi untuk membagikan pekerjaan mereka di repositori seperti GitHub.
Buat Template
Mari kita buat template untuk flow, yang kita buat di bab no 15 “Apache NiFi - Membuat Arus”.
Pilih semua komponen aliran menggunakan tombol shift dan kemudian klik ikon buat template di sisi kiri kanvas NiFi. Anda juga dapat melihat kotak alat seperti yang ditunjukkan pada gambar di atas. Klik ikon tersebutcreate templateditandai dengan warna biru seperti pada gambar di atas. Masukkan nama untuk template tersebut. Pengembang juga dapat menambahkan deskripsi, yang bersifat opsional.
Unduh Template
Lalu pergi ke opsi template NiFi di menu yang ada di sudut kanan atas NiFi UI seperti yang ditunjukkan pada gambar di bawah ini.
Sekarang klik ikon unduh (ada di sisi kanan dalam daftar) dari templat yang ingin Anda unduh. File XML dengan nama template akan diunduh.
Unggah Template
Untuk menggunakan templat di NiFi, pengembang harus mengunggah file xml-nya ke NiFi menggunakan UI. Ada ikon Unggah Template (ditandai dengan warna biru pada gambar di bawah) di samping ikon Buat Template klik itu dan jelajahi xml.
Tambahkan Template
Di toolbar atas NiFi UI, ikon templat berada sebelum ikon label. Ikon tersebut ditandai dengan warna biru seperti yang ditunjukkan pada gambar di bawah ini.
Tarik ikon template dan pilih template dari daftar drop-down dan klik tambahkan. Ini akan menambahkan template ke kanvas NiFi.
NiFi menawarkan sejumlah besar API, yang membantu pengembang membuat perubahan dan mendapatkan informasi NiFi dari alat lain atau aplikasi yang dikembangkan khusus. Dalam tutorial ini, kami akan menggunakan aplikasi tukang pos di google chrome untuk menjelaskan beberapa contoh.
Untuk menambahkan Google Chrome postmantoyour, buka URL yang disebutkan di bawah ini dan klik tombol tambahkan ke chrome. Sekarang Anda akan melihat aplikasi baru ditambahkan ke Google Chrome Anda.
toko web Chrome
Versi NiFi rest API saat ini adalah 1.8.0 dan dokumentasinya ada di URL yang disebutkan di bawah ini.
https://nifi.apache.org/docs/nifi-docs/rest-api/index.html
Berikut ini adalah Modul API istirahat NiFi yang paling banyak digunakan -
http: // <nifi url>: <nifi port> / nifi-api / <api-path>
Jika HTTPS diaktifkan https: // <nifi url>: <nifi port> / nifi-api / <api-path>
S.No. | Nama modul API | api-path | Deskripsi |
---|---|---|---|
1 | Mengakses | /mengakses | Untuk mengotentikasi pengguna dan mendapatkan token akses dari NiFi. |
2 | Kontroler | / controller | Untuk mengelola cluster dan membuat tugas pelaporan. |
3 | Layanan Pengontrol | / controller-services | Ini digunakan untuk mengelola layanan pengontrol dan memperbarui referensi layanan pengontrol. |
4 | Melaporkan Tugas | / pelaporan-tugas | Untuk mengelola tugas pelaporan. |
5 | Mengalir | /mengalir | Untuk mendapatkan metadata aliran data dan status komponen dan riwayat kueri |
6 | Grup Proses | / proses-kelompok | Untuk mengunggah dan membuat contoh template dan membuat komponen. |
7 | Prosesor | / prosesor | Untuk membuat dan menjadwalkan prosesor dan mengatur propertinya. |
8 | Koneksi | / koneksi | Untuk membuat koneksi, atur prioritas antrian dan perbarui tujuan koneksi |
9 | FlowFile Queues | / flowfile-queues | Untuk melihat konten antrian, unduh konten flowfile, dan kosongkan antrian. |
10 | Grup Proses Jarak Jauh | / remote-process-groups | Untuk membuat grup jarak jauh dan mengaktifkan transmisi. |
11 | Asal | /asal | Untuk menanyakan asal, dan mencari garis keturunan acara. |
Sekarang mari kita pertimbangkan sebuah contoh dan jalankan tukang pos untuk mendapatkan detail tentang instance NiFi yang sedang berjalan.
Permintaan
GET http://localhost:8080/nifi-api/flow/about
Tanggapan
{
"about": {
"title": "NiFi",
"version": "1.7.1",
"uri": "http://localhost:8080/nifi-api/",
"contentViewerUrl": "../nifi-content-viewer/",
"timezone": "SGT",
"buildTag": "nifi-1.7.1-RC1",
"buildTimestamp": "07/12/2018 12:54:43 SGT"
}
}
Apache NiFi mencatat dan menyimpan setiap informasi tentang peristiwa yang terjadi pada data yang diserap dalam aliran. Repositori asal data menyimpan informasi ini dan menyediakan UI untuk mencari informasi acara ini. Asal data dapat diakses untuk level NiFi penuh dan level prosesor juga.
Tabel berikut mencantumkan bidang yang berbeda dalam daftar acara NiFi Data Provenance memiliki bidang berikut -
S.No. | Nama Bidang | Deskripsi |
---|---|---|
1 | Tanggal Waktu | Tanggal dan waktu acara. |
2 | Tipe | Jenis Acara seperti 'CREATE'. |
3 | FlowFileUuid | UUID dari file alur tempat acara dijalankan. |
4 | Ukuran | Ukuran file aliran. |
5 | nama komponen | Nama komponen yang menjalankan acara tersebut. |
6 | Jenis Komponen | Jenis komponen. |
7 | Tunjukkan garis keturunan | Kolom terakhir memiliki ikon show lineage, yang digunakan untuk melihat garis keturunan flowfile seperti yang ditunjukkan pada gambar di bawah ini. |
Untuk mendapatkan informasi lebih lanjut tentang acara tersebut, pengguna dapat mengklik ikon informasi yang ada di kolom pertama dari NiFi Data Provenance UI.
Ada beberapa properti dalam file nifi.properties, yang digunakan untuk mengelola repositori NiFi Data Provenance.
S.No. | Nama properti | Nilai Default | Deskripsi |
---|---|---|---|
1 | nifi.provenance.repository.directory.default | ./provenance_repository | Untuk menentukan jalur default asal data NiFi. |
2 | nifi.provenance.repository.max.storage.time | 24 jam | Untuk menentukan waktu retensi maksimum asal data NiFi. |
3 | nifi.provenance.repository.max.storage.size | 1 GB | Untuk menentukan penyimpanan maksimum asal data NiFi. |
4 | nifi.provenance.repository.rollover.time | 30 detik | Untuk menentukan waktu rollover dari asal data NiFi. |
5 | nifi.provenance.repository.rollover.size | 100 MB | Untuk menentukan ukuran rollover dari asal data NiFi. |
6 | nifi.provenance.repository.indexed.fields | EventType, FlowFileUUID, Filename, ProcessorID, Relationship | Untuk menentukan bidang yang digunakan untuk mencari dan mengindeks asal data NiFi. |
Di Apache NiFi, ada beberapa cara untuk memantau statistik yang berbeda dari sistem seperti kesalahan, penggunaan memori, penggunaan CPU, statistik Aliran Data, dll. Kita akan membahas yang paling populer dalam tutorial ini.
Pemantauan bawaan
Di bagian ini, kita akan mempelajari lebih lanjut tentang pemantauan bawaan di Apache NiFi.
Papan pengumuman
Papan buletin menunjukkan ERROR dan PERINGATAN terbaru yang dihasilkan oleh prosesor NiFi secara real time. Untuk mengakses papan buletin, pengguna harus pergi ke menu drop-down sebelah kanan dan memilih opsi Papan Buletin. Ini menyegarkan secara otomatis dan pengguna juga dapat menonaktifkannya. Seorang pengguna juga dapat menavigasi ke prosesor sebenarnya dengan mengklik dua kali kesalahan tersebut. Seorang pengguna juga dapat memfilter buletin dengan mengerjakan yang berikut -
- melalui pesan
- dengan nama
- by id
- by group id
Data provenance UI
To monitor the Events occurring on any specific processor or throughout NiFi, a user can access the Data provenance from the same menu as the bulletin board. A user can also filter the events in data provenance repository by working out with the following fields −
- by component name
- by component type
- by type
NiFi Summary UI
Apache NiFi summary also can be accessed from the same menu as the bulletin board. This UI contains information about all the components of that particular NiFi instance or cluster. They can be filtered by name, by type or by URI. There are different tabs for different component types. Following are the components, which can be monitored in the NiFi summary UI −
- Processors
- Input ports
- Output ports
- Remote process groups
- Connections
- Process groups
In this UI, there is a link at the bottom right hand side named system diagnostics to check the JVM statistics.
Reporting Tasks
Apache NiFi provides multiple reporting tasks to support external monitoring systems like Ambari, Grafana, etc. A developer can create a custom reporting task or can configure the inbuilt ones to send the metrics of NiFi to the externals monitoring systems. The following table lists down the reporting tasks offered by NiFi 1.7.1.
S.No. | Reporting Task Name | Description |
---|---|---|
1 | AmbariReportingTask | To setup Ambari Metrics Service for NiFi. |
2 | ControllerStatusReportingTask | To report the information from the NiFi summary UI for the last 5 minute. |
3 | MonitorDiskUsage | To report and warn about the disk usage of a specific directory. |
4 | MonitorMemory | To monitor the amount of Java Heap used in a Java Memory pool of JVM. |
5 | SiteToSiteBulletinReportingTask | To report the errors and warning in bulletins using Site to Site protocol. |
6 | SiteToSiteProvenanceReportingTask | To report the NiFi Data Provenance events using Site to Site protocol. |
NiFi API
There is an API named system diagnostics, which can be used to monitor the NiFI stats in any custom developed application. Let us check the API in postman.
Request
http://localhost:8080/nifi-api/system-diagnostics
Response
{
"systemDiagnostics": {
"aggregateSnapshot": {
"totalNonHeap": "183.89 MB",
"totalNonHeapBytes": 192819200,
"usedNonHeap": "173.47 MB",
"usedNonHeapBytes": 181894560,
"freeNonHeap": "10.42 MB",
"freeNonHeapBytes": 10924640,
"maxNonHeap": "-1 bytes",
"maxNonHeapBytes": -1,
"totalHeap": "512 MB",
"totalHeapBytes": 536870912,
"usedHeap": "273.37 MB",
"usedHeapBytes": 286652264,
"freeHeap": "238.63 MB",
"freeHeapBytes": 250218648,
"maxHeap": "512 MB",
"maxHeapBytes": 536870912,
"heapUtilization": "53.0%",
"availableProcessors": 4,
"processorLoadAverage": -1,
"totalThreads": 71,
"daemonThreads": 31,
"uptime": "17:30:35.277",
"flowFileRepositoryStorageUsage": {
"freeSpace": "286.93 GB",
"totalSpace": "464.78 GB",
"usedSpace": "177.85 GB",
"freeSpaceBytes": 308090789888,
"totalSpaceBytes": 499057160192,
"usedSpaceBytes": 190966370304,
"utilization": "38.0%"
},
"contentRepositoryStorageUsage": [
{
"identifier": "default",
"freeSpace": "286.93 GB",
"totalSpace": "464.78 GB",
"usedSpace": "177.85 GB",
"freeSpaceBytes": 308090789888,
"totalSpaceBytes": 499057160192,
"usedSpaceBytes": 190966370304,
"utilization": "38.0%"
}
],
"provenanceRepositoryStorageUsage": [
{
"identifier": "default",
"freeSpace": "286.93 GB",
"totalSpace": "464.78 GB",
"usedSpace": "177.85 GB",
"freeSpaceBytes": 308090789888,
"totalSpaceBytes": 499057160192,
"usedSpaceBytes": 190966370304,
"utilization": "38.0%"
}
],
"garbageCollection": [
{
"name": "G1 Young Generation",
"collectionCount": 344,
"collectionTime": "00:00:06.239",
"collectionMillis": 6239
},
{
"name": "G1 Old Generation",
"collectionCount": 0,
"collectionTime": "00:00:00.000",
"collectionMillis": 0
}
],
"statsLastRefreshed": "09:30:20 SGT",
"versionInfo": {
"niFiVersion": "1.7.1",
"javaVendor": "Oracle Corporation",
"javaVersion": "1.8.0_151",
"osName": "Windows 7",
"osVersion": "6.1",
"osArchitecture": "amd64",
"buildTag": "nifi-1.7.1-RC1",
"buildTimestamp": "07/12/2018 12:54:43 SGT"
}
}
}
}
Sebelum memulai peningkatan Apache NiFi, baca catatan rilis untuk mengetahui tentang perubahan dan penambahan. Seorang pengguna perlu mengevaluasi dampak dari penambahan dan perubahan ini pada instalasi NiFi-nya saat ini. Di bawah ini adalah tautan untuk mendapatkan catatan rilis untuk rilis baru Apache NiFi.
https://cwiki.apache.org/confluence/display/NIFI/Release+Notes
Dalam penyiapan cluster, pengguna perlu mengupgrade penginstalan NiFi setiap Node dalam cluster. Ikuti langkah-langkah yang diberikan di bawah ini untuk meningkatkan Apache NiFi.
Cadangkan semua NAR kustom yang ada di NiFi atau lib Anda saat ini atau folder lainnya.
Unduh Apache NiFi versi baru. Di bawah ini adalah tautan untuk mengunduh sumber dan biner dari versi NiFi terbaru.
https://nifi.apache.org/download.html
Buat direktori baru di direktori instalasi yang sama dari NiFi saat ini dan ekstrak versi baru Apache NiFi.
Hentikan NiFi dengan anggun. Pertama-tama hentikan semua prosesor dan biarkan semua file aliran yang ada dalam aliran diproses. Sekali, tidak ada lagi flowfile di sana, hentikan NiFi.
Salin konfigurasi authorizers.xml dari instalasi NiFi saat ini ke versi baru.
Perbarui nilai dalam bootstrap-notification-services.xml, dan bootstrap.conf dari versi NiFi baru dari yang sekarang.
Tambahkan logging khusus dari logback.xml ke instalasi NiFi yang baru.
Konfigurasikan penyedia identitas login di login-identity-provider.xml dari versi saat ini.
Perbarui semua properti di nifi.properties dari penginstalan NiFi baru dari versi saat ini.
Harap pastikan bahwa grup dan pengguna versi baru sama dengan versi saat ini, untuk menghindari kesalahan izin ditolak.
Salin konfigurasi dari state-management.xml versi saat ini ke versi baru.
Salin konten direktori berikut dari versi penginstalan NiFi saat ini ke direktori yang sama di versi baru.
./conf/flow.xml.gz
Juga flow.xml.gz dari direktori arsip.
Untuk asal dan repositori konten mengubah nilai dalam nifi. properti file ke repositori saat ini.
salin status dari ./state/local atau ubah nifi.properties jika direktori eksternal lain ditentukan.
Periksa kembali semua perubahan yang dilakukan dan periksa apakah itu berdampak pada perubahan baru apa pun yang ditambahkan dalam versi NiFi baru. Jika ada dampak apapun, periksa solusinya.
Mulai semua node NiFi dan verifikasi apakah semua aliran berfungsi dengan benar dan repositori menyimpan data dan Ui mengambilnya dengan kesalahan apa pun.
Pantau buletin selama beberapa waktu untuk memeriksa kesalahan baru.
Jika versi baru bekerja dengan benar, maka versi saat ini dapat diarsipkan dan dihapus dari direktori.
Apache NiFi Remote Process Group atau RPG memungkinkan aliran untuk mengarahkan FlowFiles dalam aliran ke berbagai instans NiFi menggunakan protokol Site-to-Site. Mulai versi 1.7.1, NiFi tidak menawarkan hubungan yang seimbang, jadi RPG digunakan untuk penyeimbangan beban dalam aliran data NiFi.
Seorang pengembang dapat menambahkan RPG dari bilah alat atas NiFi UI dengan menyeret ikon seperti yang ditunjukkan pada gambar di atas ke kanvas. Untuk mengonfigurasi RPG, Pengembang harus menambahkan bidang berikut -
S.No. | Nama Bidang | Deskripsi |
---|---|---|
1 | URL | Untuk menentukan URL NiFi target jarak jauh yang dipisahkan koma. |
2 | Protokol Transportasi | Untuk menentukan protokol transport untuk instance NiFi jarak jauh. Baik itu RAW atau HTTP. |
3 | Antarmuka Jaringan Lokal | Untuk menentukan antarmuka jaringan lokal untuk mengirim / menerima data. |
4 | Nama Host Server Proxy HTTP | Untuk menentukan nama host server proxy untuk tujuan transportasi dalam RPG. |
5 | Porta Server Proxy HTTP | Untuk menentukan port server proxy untuk tujuan transportasi dalam RPG. |
6 | Pengguna Proksi HTTP | Ini adalah bidang opsional untuk menentukan nama pengguna untuk proxy HTTP. |
7 | Kata Sandi Proksi HTTP | Ini adalah bidang opsional untuk menentukan kata sandi untuk nama pengguna di atas. |
Pengembang perlu mengaktifkannya, sebelum menggunakannya seperti kita memulai prosesor sebelum menggunakannya.
Apache NiFi menawarkan layanan bersama, yang dapat dibagikan oleh prosesor dan tugas pelaporan disebut pengaturan pengontrol. Ini seperti kumpulan koneksi database, yang dapat digunakan oleh prosesor yang mengakses database yang sama.
Untuk mengakses pengaturan pengontrol, gunakan menu drop down di pojok kanan atas NiFi UI seperti yang ditunjukkan pada gambar di bawah ini.
Ada banyak pengaturan pengontrol yang ditawarkan oleh Apache NiFi, kita akan membahas pengaturan yang umum digunakan dan bagaimana kita mengaturnya di NiFi.
DBCPConnectionPool
Tambahkan tanda plus di halaman Pengaturan Nifi setelah mengklik opsi Pengaturan pengontrol. Kemudian pilih DBCPConnectionPool dari daftar pengaturan pengontrol. DBCPConnectionPool akan ditambahkan di halaman pengaturan NiFi utama seperti yang ditunjukkan pada gambar di bawah ini.
Ini berisi informasi berikut tentang pengontrol setting:Name
- Type
- Bundle
- State
- Scope
- Konfigurasikan dan hapus ikon
Klik pada ikon konfigurasi dan isi bidang yang diperlukan. Bidang-bidang tersebut tercantum dalam tabel di bawah ini -
S.No. | Nama Bidang | Nilai default | deskripsi |
---|---|---|---|
1 | URL Koneksi Database | kosong | Untuk menentukan URL koneksi ke database. |
2 | Nama Kelas Driver Database | kosong | Untuk menentukan nama kelas driver untuk database seperti com.mysql.jdbc.Driver untuk mysql. |
3 | Waktu Tunggu Maks | 500 mili | Untuk menentukan waktu menunggu data dari koneksi ke database. |
4 | Koneksi Total Maks | 8 | Untuk menentukan jumlah maksimum koneksi yang dialokasikan di kumpulan koneksi database. |
Untuk menghentikan atau mengkonfigurasi pengaturan pengontrol, pertama-tama semua komponen NiFi yang terpasang harus dihentikan. NiFi juga menambahkan ruang lingkup dalam pengaturan pengontrol untuk mengelola konfigurasinya. Oleh karena itu, hanya yang memiliki pengaturan yang sama tidak akan terpengaruh dan akan menggunakan pengaturan pengontrol yang sama.
Tugas pelaporan Apache NiFi mirip dengan layanan pengontrol, yang berjalan di latar belakang dan mengirim atau mencatat statistik instance NiFi. Tugas pelaporan NiFi juga dapat diakses dari halaman yang sama dengan pengaturan pengontrol, tetapi di tab yang berbeda.
Untuk menambahkan tugas pelaporan, pengembang perlu mengklik tombol plus yang ada di sisi kanan atas halaman tugas pelaporan. Tugas pelaporan ini terutama digunakan untuk memantau aktivitas instans NiFi, baik dalam buletin atau asalnya. Terutama tugas pelaporan ini menggunakan Site-to-Site untuk mengangkut data statistik NiFi ke node lain atau sistem eksternal.
Sekarang mari kita tambahkan tugas pelaporan yang dikonfigurasi untuk lebih memahami.
MonitorMemory
Tugas pelaporan ini digunakan untuk menghasilkan buletin, ketika kumpulan memori melewati persentase yang ditentukan. Ikuti langkah-langkah berikut untuk mengkonfigurasi tugas pelaporan MonitorMemory -
Tambahkan tanda plus dan cari MonitorMemory dalam daftar.
Pilih MonitorMemory dan klik TAMBAH.
Setelah ditambahkan di halaman utama halaman utama tugas pelaporan, klik ikon konfigurasi.
Di tab properti, pilih kumpulan memori, yang ingin Anda pantau.
Pilih persentase yang Anda inginkan buletin untuk mengingatkan pengguna.
Mulai tugas pelaporan.
Apache NiFi - Prosesor Kustom
Apache NiFi adalah platform sumber terbuka dan memberi pengembang opsi untuk menambahkan prosesor kustom mereka di pustaka NiFi. Ikuti langkah-langkah ini untuk membuat prosesor kustom.
Unduh Maven versi terbaru dari tautan yang diberikan di bawah ini.
https://maven.apache.org/download.cgi
Tambahkan variabel lingkungan bernama M2_HOME dan tetapkan nilai sebagai direktori instalasi maven.
Unduh Eclipse IDE dari tautan di bawah ini.
https://www.eclipse.org/downloads/download.php
Buka command prompt dan jalankan perintah Maven Archetype.
> mvn archetype:generate
Cari jenis nifi dalam proyek arketipe.
Pilih org.apache.nifi: proyek nifi-processor-bundle-archetype.
Kemudian dari daftar versi pilih versi terbaru yaitu 1.7.1 untuk tutorial ini.
Masukkan groupId, artifactId, versi, paket, dan artifactBaseName dll.
Kemudian proyek maven akan dibuat dengan direktori.
nifi-<artifactBaseName>-processors
nifi-<artifactBaseName>-nar
Jalankan perintah di bawah ini di direktori nifi- <artifactBaseName> -processors untuk menambahkan proyek di eclipse.
mvn install eclipse:eclipse
Buka eclipse dan pilih impor dari menu file.
Kemudian pilih "Existing Projects into workspace" dan tambahkan proyek dari direktori nifi- <artifactBaseName> -processors di eclipse.
Tambahkan kode Anda di fungsi public void onTrigger (konteks ProsesContext, sesi ProsesSesi), yang berjalan kapan pun prosesor dijadwalkan untuk dijalankan.
Kemudian paketkan kode ke file NAR dengan menjalankan perintah yang disebutkan di bawah ini.
mvn clean install
File NAR akan dibuat di nifi-
-nar / target direktori. Salin file NAR ke folder lib Apache NiFi dan mulai ulang NiFi.
Setelah NiFi berhasil dimulai ulang, periksa daftar prosesor untuk prosesor kustom baru.
Untuk kesalahan apa pun, periksa file ./logs/nifi.log.
Apache NiFi - Layanan Pengontrol Kustom
Apache NiFi adalah platform sumber terbuka dan memberi pengembang opsi untuk menambahkan layanan pengontrol khusus mereka di Apache NiFi. Langkah-langkah dan alatnya hampir sama seperti yang digunakan untuk membuat prosesor khusus.
Buka command prompt dan jalankan perintah Maven Archetype.
> mvn archetype:generate
Cari jenis nifi dalam proyek arketipe.
Pilih org.apache.nifi:nifi-service-bundle-archetype proyek.
Kemudian dari daftar versi, pilih versi terbaru - 1.7.1 untuk tutorial ini.
Masukkan groupId, artifactId, versi, paket, dan artifactBaseName, dll.
Proyek maven akan dibuat dengan direktori.
nifi-<artifactBaseName>
nifi-<artifactBaseName>-nar
nifi-<artifactBaseName>-api
nifi-<artifactBaseName>-api-nar
Jalankan perintah di bawah ini di direktori nifi- <artifactBaseName> dan nifi- <artifactBaseName> -api untuk menambahkan dua proyek ini di gerhana.
mvn menginstal eclipse: eclipse
Buka eclipse dan pilih impor dari menu file.
Kemudian pilih "Proyek yang Ada ke dalam ruang kerja" dan tambahkan proyek dari direktori nifi- <artifactBaseName> dan nifi- <artifactBaseName> -api di eclipse.
Tambahkan kode Anda di file sumber.
Kemudian paketkan kode ke file NAR dengan menjalankan perintah yang disebutkan di bawah ini.
mvn bersih instal
Dua file NAR akan dibuat di setiap direktori nifi- <artifactBaseName> / target dan nifi- <artifactBaseName> -api / target.
Salin file NAR ini ke folder lib Apache NiFi dan mulai ulang NiFi.
Setelah NiFi berhasil dimulai ulang, periksa daftar prosesor untuk prosesor kustom baru.
Untuk setiap kesalahan, periksa ./logs/nifi.log mengajukan.
Apache NiFi - Pencatatan
Apache NiFi menggunakan pustaka logback untuk menangani pencatatannya. Ada file logback.xml yang ada di direktori conf NiFi, yang digunakan untuk mengkonfigurasi logging di NiFi. Log dibuat di folder log NiFi dan file log dijelaskan di bawah ini.
nifi-app.log
Ini adalah file log utama nifi, yang mencatat semua aktivitas aplikasi apache NiFi mulai dari pemuatan file NAR hingga error run time atau buletin yang ditemukan oleh komponen NiFi. Di bawah ini adalah appender default dalamlogback.xml file untuk nifi-app.log mengajukan.
<appender name="APP_FILE"
class="ch.qos.logback.core.rolling.RollingFileAppender">
<file>${org.apache.nifi.bootstrap.config.log.dir}/nifi-app.log</file>
<rollingPolicy
class="ch.qos.logback.core.rolling.SizeAndTimeBasedRollingPolicy">
<fileNamePattern>
${org.apache.nifi.bootstrap.config.log.dir}/
nifi-app_%d{yyyy-MM-dd_HH}.%i.log
</fileNamePattern>
<maxFileSize>100MB</maxFileSize>
<maxHistory>30</maxHistory>
</rollingPolicy>
<immediateFlush>true</immediateFlush>
<encoder class="ch.qos.logback.classic.encoder.PatternLayoutEncoder">
<pattern>%date %level [%thread] %logger{40} %msg%n</pattern>
</encoder>
</appender>
Nama appendernya adalah APP_FILE, dan kelasnya adalah RollingFileAppender, yang berarti logger menggunakan kebijakan rollback. Secara default, ukuran file maksimal adalah 100 MB dan dapat diubah ke ukuran yang diinginkan. Retensi maksimum untuk APP_FILE adalah 30 file log dan dapat diubah sesuai kebutuhan pengguna.
nifi-user.log
Log ini berisi peristiwa pengguna seperti keamanan web, konfigurasi api web, otorisasi pengguna, dll. Di bawah ini adalah appender untuk nifi-user.log di file logback.xml.
<appender name="USER_FILE"
class="ch.qos.logback.core.rolling.RollingFileAppender">
<file>${org.apache.nifi.bootstrap.config.log.dir}/nifi-user.log</file>
<rollingPolicy class="ch.qos.logback.core.rolling.TimeBasedRollingPolicy">
<fileNamePattern>
${org.apache.nifi.bootstrap.config.log.dir}/
nifi-user_%d.log
</fileNamePattern>
<maxHistory>30</maxHistory>
</rollingPolicy>
<encoder class="ch.qos.logback.classic.encoder.PatternLayoutEncoder">
<pattern>%date %level [%thread] %logger{40} %msg%n</pattern>
</encoder>
</appender>
Nama pelengkap adalah USER_FILE. Ini mengikuti kebijakan rollover. Periode retensi maksimum untuk USER_FILE adalah 30 file log. Di bawah ini adalah logger default untuk USER_FILE appender yang ada di nifi-user.log.
<logger name="org.apache.nifi.web.security" level="INFO" additivity="false">
<appender-ref ref="USER_FILE"/>
</logger>
<logger name="org.apache.nifi.web.api.config" level="INFO" additivity="false">
<appender-ref ref="USER_FILE"/>
</logger>
<logger name="org.apache.nifi.authorization" level="INFO" additivity="false">
<appender-ref ref="USER_FILE"/>
</logger>
<logger name="org.apache.nifi.cluster.authorization" level="INFO" additivity="false">
<appender-ref ref="USER_FILE"/>
</logger>
<logger name="org.apache.nifi.web.filter.RequestLogger" level="INFO" additivity="false">
<appender-ref ref="USER_FILE"/>
</logger>
nifi-bootstrap.log
Log ini berisi log bootstrap, keluaran standar apache NiFi (semua system.out ditulis dalam kode terutama untuk debugging), dan kesalahan standar (semua system.err tertulis dalam kode). Di bawah ini adalah appender default untuk nifi-bootstrap.log di logback.log.
<appender name="BOOTSTRAP_FILE" class="ch.qos.logback.core.rolling.RollingFileAppender">
<file>${org.apache.nifi.bootstrap.config.log.dir}/nifi-bootstrap.log</file>
<rollingPolicy class="ch.qos.logback.core.rolling.TimeBasedRollingPolicy">
<fileNamePattern>
${org.apache.nifi.bootstrap.config.log.dir}/nifi-bootstrap_%d.log
</fileNamePattern>
<maxHistory>5</maxHistory>
</rollingPolicy>
<encoder class="ch.qos.logback.classic.encoder.PatternLayoutEncoder">
<pattern>%date %level [%thread] %logger{40} %msg%n</pattern>
</encoder>
</appender>
nifi-bootstrap.log, nama appendernya adalah BOOTSTRAP_FILE, yang juga mengikuti kebijakan rollback. Retensi maksimum untuk BOOTSTRAP_FILE appender adalah 5 file log. Di bawah ini adalah logger default untuk file nifi-bootstrap.log.
<logger name="org.apache.nifi.bootstrap" level="INFO" additivity="false">
<appender-ref ref="BOOTSTRAP_FILE" />
</logger>
<logger name="org.apache.nifi.bootstrap.Command" level="INFO" additivity="false">
<appender-ref ref="CONSOLE" />
<appender-ref ref="BOOTSTRAP_FILE" />
</logger>
<logger name="org.apache.nifi.StdOut" level="INFO" additivity="false">
<appender-ref ref="BOOTSTRAP_FILE" />
</logger>
<logger name="org.apache.nifi.StdErr" level="ERROR" additivity="false">
<appender-ref ref="BOOTSTRAP_FILE" />
</logger>