Apache NiFi - โปรเซสเซอร์

โปรเซสเซอร์ Apache NiFi เป็นบล็อกพื้นฐานในการสร้างกระแสข้อมูล โปรเซสเซอร์ทุกตัวมีฟังก์ชันการทำงานที่แตกต่างกันซึ่งมีส่วนช่วยในการสร้างโฟลว์ไฟล์เอาต์พุต Dataflow ที่แสดงในภาพด้านล่างกำลังดึงไฟล์จากไดเร็กทอรีหนึ่งโดยใช้โปรเซสเซอร์ GetFile และจัดเก็บไว้ในไดเร็กทอรีอื่นโดยใช้ตัวประมวลผล PutFile

GetFile

กระบวนการ GetFile ใช้เพื่อดึงไฟล์ในรูปแบบเฉพาะจากไดเร็กทอรีเฉพาะ นอกจากนี้ยังมีตัวเลือกอื่น ๆ ให้กับผู้ใช้เพื่อให้สามารถควบคุมการดึงข้อมูลได้มากขึ้น เราจะพูดถึงในส่วนคุณสมบัติด้านล่าง

การตั้งค่า GetFile

ต่อไปนี้คือการตั้งค่าต่างๆของโปรเซสเซอร์ GetFile -

ชื่อ

ในการตั้งค่าชื่อผู้ใช้สามารถกำหนดชื่อใด ๆ สำหรับโปรเซสเซอร์ตามโปรเจ็กต์หรือตามนั้นซึ่งทำให้ชื่อมีความหมายมากขึ้น

เปิดใช้งาน

ผู้ใช้สามารถเปิดหรือปิดใช้งานโปรเซสเซอร์โดยใช้การตั้งค่านี้

ระยะเวลาการลงโทษ

การตั้งค่านี้ช่วยให้ผู้ใช้สามารถเพิ่มระยะเวลาการลงโทษได้ในกรณีที่ไฟล์โฟลว์ไฟล์ล้มเหลว

ระยะเวลาผลผลิต

การตั้งค่านี้ใช้เพื่อระบุเวลาผลผลิตสำหรับโปรเซสเซอร์ ในช่วงเวลานี้กระบวนการจะไม่ถูกกำหนดอีกครั้ง

ระดับแถลงการณ์

การตั้งค่านี้ใช้เพื่อระบุระดับบันทึกของโปรเซสเซอร์นั้น

ยุติความสัมพันธ์โดยอัตโนมัติ

ซึ่งมีรายการตรวจสอบความสัมพันธ์ที่มีอยู่ทั้งหมดของกระบวนการนั้น ๆ เมื่อทำเครื่องหมายในช่องนี้ผู้ใช้สามารถตั้งโปรแกรมตัวประมวลผลเพื่อยุติไฟล์โฟลว์ไฟล์ในเหตุการณ์นั้นและไม่ส่งต่อไปในโฟลว์

GetFile การจัดกำหนดการ

นี่คือตัวเลือกการตั้งเวลาต่อไปนี้ที่นำเสนอโดยโปรเซสเซอร์ GetFile -

กำหนดเวลากลยุทธ์

คุณสามารถกำหนดเวลากระบวนการตามเวลาโดยเลือกเวลาขับเคลื่อนหรือสตริง CRON ที่ระบุโดยเลือกตัวเลือกไดรเวอร์ CRON

งานพร้อมกัน

อ็อพชันนี้ใช้เพื่อกำหนดตารางงานพร้อมกันสำหรับโปรเซสเซอร์นี้

การดำเนินการ

ผู้ใช้สามารถกำหนดว่าจะรันโปรเซสเซอร์ในโหนดทั้งหมดหรือเฉพาะในโหนดหลักโดยใช้อ็อพชันนี้

เรียกใช้กำหนดการ

ใช้เพื่อกำหนดเวลาสำหรับกลยุทธ์ที่ขับเคลื่อนด้วยเวลาหรือนิพจน์ CRON สำหรับกลยุทธ์ที่ขับเคลื่อนด้วย CRON

คุณสมบัติ GetFile

GetFile นำเสนอคุณสมบัติหลายอย่างดังที่แสดงในภาพด้านล่างโดยใช้คุณสมบัติบังคับเช่นไดเร็กทอรีอินพุตและตัวกรองไฟล์ไปยังคุณสมบัติเสริมเช่นตัวกรองพา ธ และขนาดไฟล์สูงสุด ผู้ใช้สามารถจัดการกระบวนการดึงไฟล์โดยใช้คุณสมบัติเหล่านี้

GetFile ความคิดเห็น

ส่วนนี้ใช้เพื่อระบุข้อมูลเกี่ยวกับโปรเซสเซอร์

PutFile

ตัวประมวลผล PutFile ใช้เพื่อจัดเก็บไฟล์จากโฟลว์ข้อมูลไปยังตำแหน่งเฉพาะ

การตั้งค่า PutFile

โปรเซสเซอร์ PutFile มีการตั้งค่าดังต่อไปนี้ -

ชื่อ

ในการตั้งค่าชื่อผู้ใช้สามารถกำหนดชื่อใด ๆ สำหรับโปรเซสเซอร์ตามโปรเจ็กต์หรือตามที่ทำให้ชื่อมีความหมายมากขึ้น

เปิดใช้งาน

ผู้ใช้สามารถเปิดหรือปิดใช้งานโปรเซสเซอร์โดยใช้การตั้งค่านี้

ระยะเวลาการลงโทษ

การตั้งค่านี้ช่วยให้ผู้ใช้สามารถเพิ่มระยะเวลาการลงโทษได้ในกรณีที่ไฟล์โฟลว์ไฟล์ล้มเหลว

ระยะเวลาผลผลิต

การตั้งค่านี้ใช้เพื่อระบุเวลาผลผลิตสำหรับโปรเซสเซอร์ ในช่วงเวลานี้กระบวนการจะไม่ถูกกำหนดเวลาอีกครั้ง

ระดับแถลงการณ์

การตั้งค่านี้ใช้เพื่อระบุระดับบันทึกของโปรเซสเซอร์นั้น

ยุติความสัมพันธ์โดยอัตโนมัติ

การตั้งค่านี้มีรายการตรวจสอบความสัมพันธ์ที่มีอยู่ทั้งหมดของกระบวนการนั้น ๆ เมื่อทำเครื่องหมายในช่องนี้ผู้ใช้สามารถตั้งโปรแกรมตัวประมวลผลเพื่อยุติไฟล์โฟลว์ไฟล์ในเหตุการณ์นั้นและไม่ต้องส่งต่อไปในโฟลว์

การตั้งเวลา PutFile

นี่คือตัวเลือกการตั้งเวลาต่อไปนี้ที่นำเสนอโดยโปรเซสเซอร์ PutFile -

กำหนดเวลากลยุทธ์

คุณสามารถกำหนดเวลากระบวนการตามเวลาได้โดยเลือกตัวจับเวลาขับเคลื่อนหรือสตริง CRON ที่ระบุโดยเลือกตัวเลือกไดรเวอร์ CRON นอกจากนี้ยังมีการขับเคลื่อนเหตุการณ์กลยุทธ์การทดลองซึ่งจะทริกเกอร์โปรเซสเซอร์ในเหตุการณ์หนึ่ง ๆ

งานพร้อมกัน

อ็อพชันนี้ใช้เพื่อกำหนดตารางงานพร้อมกันสำหรับโปรเซสเซอร์นี้

การดำเนินการ

ผู้ใช้สามารถกำหนดว่าจะรันโปรเซสเซอร์ในโหนดทั้งหมดหรือเฉพาะในโหนดหลักโดยใช้อ็อพชันนี้

เรียกใช้กำหนดการ

ใช้เพื่อกำหนดเวลาสำหรับกลยุทธ์ที่ขับเคลื่อนด้วยตัวจับเวลาหรือนิพจน์ CRON สำหรับกลยุทธ์ที่ขับเคลื่อนด้วย CRON

คุณสมบัติ PutFile

ตัวประมวลผล PutFile มีคุณสมบัติเช่น Directory เพื่อระบุไดเร็กทอรีเอาต์พุตสำหรับวัตถุประสงค์ในการถ่ายโอนไฟล์และอื่น ๆ เพื่อจัดการการถ่ายโอนดังแสดงในภาพด้านล่าง

ความคิดเห็น PutFile

ส่วนนี้ใช้เพื่อระบุข้อมูลเกี่ยวกับโปรเซสเซอร์