Apache NiFi - Bộ xử lý

Bộ xử lý Apache NiFi là khối cơ bản để tạo luồng dữ liệu. Mỗi bộ xử lý có chức năng khác nhau, góp phần tạo ra luồng đầu ra. Dataflow được hiển thị trong hình ảnh bên dưới đang tìm nạp tệp từ một thư mục bằng bộ xử lý GetFile và lưu trữ nó trong một thư mục khác bằng bộ xử lý PutFile.

Có được file

Quá trình GetFile được sử dụng để tìm nạp các tệp có định dạng cụ thể từ một thư mục cụ thể. Nó cũng cung cấp các tùy chọn khác cho người dùng để kiểm soát nhiều hơn trong việc tìm nạp. Chúng tôi sẽ thảo luận về nó trong phần thuộc tính bên dưới.

Cài đặt GetFile

Sau đây là các cài đặt khác nhau của bộ xử lý GetFile:

Tên

Trong cài đặt Tên, người dùng có thể xác định bất kỳ tên nào cho bộ xử lý theo dự án hoặc theo dự án, điều này làm cho tên có ý nghĩa hơn.

Kích hoạt

Người dùng có thể bật hoặc tắt bộ xử lý bằng cài đặt này.

Thời hạn phạt

Cài đặt này cho phép người dùng thêm khoảng thời gian phạt, trong trường hợp có lỗi lưu lượng.

Thời lượng lợi nhuận

Cài đặt này được sử dụng để chỉ định thời gian năng suất cho bộ xử lý. Trong khoảng thời gian này, quá trình sẽ không được lên lịch nữa.

Cấp bản tin

Cài đặt này được sử dụng để chỉ định mức nhật ký của bộ xử lý đó.

Tự động chấm dứt các mối quan hệ

Điều này có một danh sách kiểm tra tất cả các mối quan hệ có sẵn của quy trình cụ thể đó. Bằng cách chọn các hộp, người dùng có thể lập trình bộ xử lý để kết thúc luồng dữ liệu về sự kiện đó và không gửi thêm nó trong luồng.

Lập lịch GetFile

Đây là các tùy chọn lập lịch sau do bộ xử lý GetFile cung cấp -

Chiến lược lịch trình

Bạn có thể lên lịch quá trình trên cơ sở thời gian bằng cách chọn thời gian điều khiển hoặc một chuỗi CRON cụ thể bằng cách chọn tùy chọn trình điều khiển CRON.

Nhiệm vụ đồng thời

Tùy chọn này được sử dụng để xác định lịch tác vụ đồng thời cho bộ xử lý này.

Chấp hành

Người dùng có thể xác định chạy bộ xử lý trong tất cả các nút hay chỉ trong nút Chính bằng cách sử dụng tùy chọn này.

Lịch chạy

Nó được sử dụng để xác định thời gian cho chiến lược định hướng thời gian hoặc biểu thức CRON cho chiến lược định hướng CRON.

Thuộc tính GetFile

GetFile cung cấp nhiều thuộc tính như thể hiện trong hình bên dưới, sử dụng các thuộc tính bắt buộc như Thư mục đầu vào và bộ lọc tệp đến các thuộc tính tùy chọn như Bộ lọc đường dẫn và Kích thước tệp tối đa. Người dùng có thể quản lý quá trình tìm nạp tệp bằng các thuộc tính này.

Nhận xét GetFile

Phần này được sử dụng để chỉ định bất kỳ thông tin nào về bộ xử lý.

PutFile

Bộ xử lý PutFile được sử dụng để lưu trữ tệp từ luồng dữ liệu đến một vị trí cụ thể.

Cài đặt PutFile

Bộ xử lý PutFile có các cài đặt sau:

Tên

Trong cài đặt Tên, người dùng có thể xác định bất kỳ tên nào cho các bộ xử lý theo dự án hoặc theo tên đó làm cho tên có ý nghĩa hơn.

Kích hoạt

Người dùng có thể bật hoặc tắt bộ xử lý bằng cài đặt này.

Thời hạn phạt

Cài đặt này cho phép người dùng thêm khoảng thời gian phạt, trong trường hợp có lỗi lưu lượng.

Thời lượng lợi nhuận

Cài đặt này được sử dụng để chỉ định thời gian năng suất cho bộ xử lý. Trong khoảng thời gian này, quá trình sẽ không được lên lịch nữa.

Cấp bản tin

Cài đặt này được sử dụng để chỉ định mức nhật ký của bộ xử lý đó.

Tự động chấm dứt các mối quan hệ

Cài đặt này có một danh sách kiểm tra tất cả các mối quan hệ có sẵn của quy trình cụ thể đó. Bằng cách chọn các hộp, người dùng có thể lập trình bộ xử lý để kết thúc luồng trên sự kiện đó và không gửi thêm nó trong luồng.

Lập lịch PutFile

Đây là các tùy chọn lập lịch sau do bộ xử lý PutFile cung cấp -

Chiến lược lịch trình

Bạn có thể lên lịch cho quá trình trên cơ sở thời gian bằng cách chọn bộ điều khiển hẹn giờ hoặc một chuỗi CRON được chỉ định bằng cách chọn tùy chọn trình điều khiển CRON. Ngoài ra còn có chiến lược thử nghiệm Theo hướng sự kiện, sẽ kích hoạt bộ xử lý trên một sự kiện cụ thể.

Nhiệm vụ đồng thời

Tùy chọn này được sử dụng để xác định lịch tác vụ đồng thời cho bộ xử lý này.

Chấp hành

Người dùng có thể xác định chạy bộ xử lý trong tất cả các nút hay chỉ trong nút chính bằng cách sử dụng tùy chọn này.

Lịch chạy

Nó được sử dụng để xác định thời gian cho chiến lược định hướng theo bộ đếm thời gian hoặc biểu thức CRON cho chiến lược định hướng CRON.

Thuộc tính PutFile

Bộ xử lý PutFile cung cấp các thuộc tính như Thư mục để chỉ định thư mục đầu ra cho mục đích truyền tệp và các thuộc tính khác để quản lý việc truyền như thể hiện trong hình bên dưới.

Nhận xét về PutFile

Phần này được sử dụng để chỉ định bất kỳ thông tin nào về bộ xử lý.