Apache NiFi - การจัดหมวดหมู่โปรเซสเซอร์

ในบทนี้เราจะพูดถึงการจัดหมวดหมู่กระบวนการใน Apache NiFi

โปรเซสเซอร์การนำเข้าข้อมูล

ตัวประมวลผลภายใต้หมวดการส่งผ่านข้อมูลใช้เพื่อนำเข้าข้อมูลลงในโฟลว์ข้อมูล NiFi ส่วนใหญ่เป็นจุดเริ่มต้นของการไหลของข้อมูลใน apache NiFi โปรเซสเซอร์บางตัวที่อยู่ในหมวดหมู่เหล่านี้ ได้แก่ GetFile, GetHTTP, GetFTP, GetKAFKA เป็นต้น

กระบวนการกำหนดเส้นทางและการไกล่เกลี่ย

ตัวประมวลผลการกำหนดเส้นทางและสื่อกลางใช้เพื่อกำหนดเส้นทางไฟล์โฟลว์ไปยังตัวประมวลผลหรือโฟลว์ข้อมูลอื่นตามข้อมูลในแอตทริบิวต์หรือเนื้อหาของโฟลว์ไฟล์ โปรเซสเซอร์เหล่านี้ยังรับผิดชอบในการควบคุมกระแสข้อมูล NiFi โปรเซสเซอร์บางตัวที่อยู่ในหมวดหมู่นี้ ได้แก่ RouteOnAttribute, RouteOnContent, ControlRate, RouteText เป็นต้น

โปรเซสเซอร์การเข้าถึงฐานข้อมูล

โปรเซสเซอร์ของประเภทการเข้าถึงฐานข้อมูลนี้สามารถเลือกหรือแทรกข้อมูลหรือดำเนินการและจัดเตรียมคำสั่ง SQL อื่น ๆ จากฐานข้อมูล โปรเซสเซอร์เหล่านี้ใช้การตั้งค่าคอนโทรลเลอร์พูลการเชื่อมต่อข้อมูลของ Apache NiFi เป็นหลัก โปรเซสเซอร์บางตัวที่อยู่ในหมวดหมู่นี้ ได้แก่ ExecuteSQL, PutSQL, PutDatabaseRecord, ListDatabaseTables เป็นต้น

Attribute Extraction โปรเซสเซอร์

Attribute Extraction Processors มีหน้าที่ในการแยกวิเคราะห์เปลี่ยนแปลงการประมวลผลแอตทริบิวต์ flowfile ในโฟลว์ข้อมูล NiFi โปรเซสเซอร์บางตัวที่อยู่ในประเภทนี้ ได้แก่ UpdateAttribute, EvaluateJSONPath, ExtractText, AttributesToJSON และอื่น ๆ

โปรเซสเซอร์ปฏิสัมพันธ์ของระบบ

โปรเซสเซอร์ System Interaction ใช้เพื่อรันกระบวนการหรือคำสั่งในระบบปฏิบัติการใด ๆ โปรเซสเซอร์เหล่านี้ยังรันสคริปต์ในหลายภาษาเพื่อโต้ตอบกับระบบต่างๆ โปรเซสเซอร์บางตัวที่อยู่ในหมวดหมู่นี้ ได้แก่ ExecuteScript, ExecuteProcess, ExecuteGroovyScript, ExecuteStreamCommand เป็นต้น

โปรเซสเซอร์การแปลงข้อมูล

โปรเซสเซอร์ที่อยู่ในการแปลงข้อมูลสามารถแก้ไขเนื้อหาของโฟลว์ไฟล์ได้ สิ่งเหล่านี้สามารถใช้เพื่อแทนที่ข้อมูลของโฟลว์ไฟล์ได้อย่างสมบูรณ์โดยปกติจะใช้เมื่อผู้ใช้ต้องส่งโฟลว์ไฟล์เป็นตัว HTTP เพื่อเรียกใช้ตัวประมวลผล HTTP โปรเซสเซอร์บางตัวที่อยู่ในหมวดหมู่นี้ ได้แก่ ReplaceText, JoltTransformJSON เป็นต้น

การส่งตัวประมวลผลข้อมูล

โดยทั่วไปการส่งตัวประมวลผลข้อมูลเป็นตัวประมวลผลปลายทางในโฟลว์ข้อมูล โปรเซสเซอร์เหล่านี้มีหน้าที่จัดเก็บหรือส่งข้อมูลไปยังเซิร์ฟเวอร์ปลายทาง หลังจากจัดเก็บหรือส่งข้อมูลสำเร็จแล้วโปรเซสเซอร์เหล่านี้จะปล่อยโฟลว์ไฟล์ด้วยความสัมพันธ์สำเร็จ โปรเซสเซอร์บางตัวที่อยู่ในประเภทนี้ ได้แก่ PutEmail, PutKafka, PutSFTP, PutFile, PutFTP เป็นต้น

โปรเซสเซอร์การแยกและการรวม

โปรเซสเซอร์เหล่านี้ใช้เพื่อแยกและรวมเนื้อหาที่มีอยู่ในโฟลว์ไฟล์ โปรเซสเซอร์บางตัวที่อยู่ในหมวดหมู่นี้ ได้แก่ SplitText, SplitJson, SplitXml, MergeContent, SplitContent เป็นต้น

โปรเซสเซอร์ HTTP

โปรเซสเซอร์เหล่านี้จัดการกับการเรียก HTTP และ HTTPS โปรเซสเซอร์บางตัวที่อยู่ในหมวดหมู่นี้ ได้แก่ InvokeHTTP, PostHTTP, ListenHTTP เป็นต้น

โปรเซสเซอร์ AWS

โปรเซสเซอร์ AWS มีหน้าที่ในการโต้ตอบกับระบบบริการเว็บของ Amazon โปรเซสเซอร์บางตัวที่อยู่ในหมวดหมู่นี้ ได้แก่ GetSQS, PutSNS, PutS3Object, FetchS3Object เป็นต้น