Apache NiFi-프로세서

Apache NiFi 프로세서는 데이터 흐름을 생성하는 기본 블록입니다. 모든 프로세서에는 출력 플로우 파일 생성에 기여하는 서로 다른 기능이 있습니다. 아래 이미지에 표시된 데이터 흐름은 GetFile 프로세서를 사용하여 한 디렉터리에서 파일을 가져오고 PutFile 프로세서를 사용하여 다른 디렉터리에 저장하는 것입니다.

GetFile

GetFile 프로세스는 특정 디렉토리에서 특정 형식의 파일을 가져 오는 데 사용됩니다. 또한 가져 오기에 대한 더 많은 제어를 위해 사용자에게 다른 옵션을 제공합니다. 아래 속성 섹션에서 논의 할 것입니다.

GetFile 설정

다음은 GetFile 프로세서의 다른 설정입니다-

이름

이름 설정에서 사용자는 프로젝트에 따라 또는 그에 따라 프로세서의 이름을 정의 할 수 있으므로 이름이 더 의미가 있습니다.

활성화

사용자는이 설정을 사용하여 프로세서를 활성화하거나 비활성화 할 수 있습니다.

페널티 기간

이 설정을 통해 사용자는 플로우 파일 실패시 페널티 기간을 추가 할 수 있습니다.

수율 기간

이 설정은 프로세서의 양보 시간을 지정하는 데 사용됩니다. 이 기간 동안 프로세스는 다시 예약되지 않습니다.

게시판 수준

이 설정은 해당 프로세서의 로그 수준을 지정하는 데 사용됩니다.

관계 자동 종료

여기에는 해당 특정 프로세스의 사용 가능한 모든 관계에 대한 검사 목록이 있습니다. 상자를 선택하면 사용자는 해당 이벤트에서 플로우 파일을 종료하고 플로우에서 더 이상 전송하지 않도록 프로세서를 프로그래밍 할 수 있습니다.

GetFile 스케줄링

이들은 GetFile 프로세서가 제공하는 다음과 같은 스케줄링 옵션입니다.

일정 전략

시간 기반을 선택하거나 CRON 드라이버 옵션을 선택하여 지정된 CRON 문자열을 선택하여 시간을 기준으로 프로세스를 예약 할 수 있습니다.

동시 작업

이 옵션은이 프로세서에 대한 동시 작업 일정을 정의하는 데 사용됩니다.

실행

사용자는이 옵션을 사용하여 모든 노드에서 프로세서를 실행할지 또는 기본 노드에서만 실행할지 정의 할 수 있습니다.

실행 일정

시간 기반 전략 또는 CRON 기반 전략의 CRON 표현에 대한 시간을 정의하는 데 사용됩니다.

GetFile 속성

GetFile은 아래 이미지와 같이 경로 필터 및 최대 파일 크기와 같은 선택적 속성에 대한 입력 디렉터리 및 파일 필터와 같은 필수 속성을 제공하는 여러 속성을 제공합니다. 사용자는 이러한 속성을 사용하여 파일 가져 오기 프로세스를 관리 할 수 ​​있습니다.

GetFile 주석

이 섹션은 프로세서에 대한 정보를 지정하는 데 사용됩니다.

PutFile

PutFile 프로세서는 데이터 흐름에서 특정 위치로 파일을 저장하는 데 사용됩니다.

PutFile 설정

PutFile 프로세서에는 다음과 같은 설정이 있습니다.

이름

이름 설정에서 사용자는 프로젝트에 따라 또는 이름을보다 의미있게 만드는 것으로 프로세서의 이름을 정의 할 수 있습니다.

활성화

사용자는이 설정을 사용하여 프로세서를 활성화하거나 비활성화 할 수 있습니다.

페널티 기간

이 설정을 사용하면 사용자가 플로우 파일 실패시 페널티 기간을 추가 할 수 있습니다.

수율 기간

이 설정은 프로세서의 양보 시간을 지정하는 데 사용됩니다. 이 기간 동안 프로세스는 다시 예약되지 않습니다.

게시판 수준

이 설정은 해당 프로세서의 로그 수준을 지정하는 데 사용됩니다.

관계 자동 종료

이 설정에는 해당 특정 프로세스의 사용 가능한 모든 관계에 대한 검사 목록이 있습니다. 확인란을 선택하여 사용자는 해당 이벤트에서 플로우 파일을 종료하고 플로우에서 더 이상 전송하지 않도록 프로세서를 프로그래밍 할 수 있습니다.

PutFile 스케줄링

다음은 PutFile 프로세서가 제공하는 다음과 같은 스케줄링 옵션입니다.

일정 전략

타이머 구동을 선택하거나 CRON 드라이버 옵션을 선택하여 지정된 CRON 문자열을 선택하여 시간 기준으로 프로세스를 예약 할 수 있습니다. 특정 이벤트에서 프로세서를 트리거하는 실험적 전략 이벤트 기반도 있습니다.

동시 작업

이 옵션은이 프로세서에 대한 동시 작업 일정을 정의하는 데 사용됩니다.

실행

사용자는이 옵션을 사용하여 모든 노드에서 프로세서를 실행할지 또는 기본 노드에서만 실행할지를 정의 할 수 있습니다.

실행 일정

타이머 기반 전략 또는 CRON 기반 전략에 대한 CRON 표현에 대한 시간을 정의하는 데 사용됩니다.

PutFile 속성

PutFile 프로세서는 디렉토리와 같은 속성을 제공하여 파일 전송을위한 출력 디렉토리를 지정하고 기타는 아래 이미지와 같이 전송을 관리합니다.

PutFile 주석

이 섹션은 프로세서에 대한 정보를 지정하는 데 사용됩니다.