Apache NiFi-프로세서
Apache NiFi 프로세서는 데이터 흐름을 생성하는 기본 블록입니다. 모든 프로세서에는 출력 플로우 파일 생성에 기여하는 서로 다른 기능이 있습니다. 아래 이미지에 표시된 데이터 흐름은 GetFile 프로세서를 사용하여 한 디렉터리에서 파일을 가져오고 PutFile 프로세서를 사용하여 다른 디렉터리에 저장하는 것입니다.
GetFile
GetFile 프로세스는 특정 디렉토리에서 특정 형식의 파일을 가져 오는 데 사용됩니다. 또한 가져 오기에 대한 더 많은 제어를 위해 사용자에게 다른 옵션을 제공합니다. 아래 속성 섹션에서 논의 할 것입니다.
GetFile 설정
다음은 GetFile 프로세서의 다른 설정입니다-
이름
이름 설정에서 사용자는 프로젝트에 따라 또는 그에 따라 프로세서의 이름을 정의 할 수 있으므로 이름이 더 의미가 있습니다.
활성화
사용자는이 설정을 사용하여 프로세서를 활성화하거나 비활성화 할 수 있습니다.
페널티 기간
이 설정을 통해 사용자는 플로우 파일 실패시 페널티 기간을 추가 할 수 있습니다.
수율 기간
이 설정은 프로세서의 양보 시간을 지정하는 데 사용됩니다. 이 기간 동안 프로세스는 다시 예약되지 않습니다.
게시판 수준
이 설정은 해당 프로세서의 로그 수준을 지정하는 데 사용됩니다.
관계 자동 종료
여기에는 해당 특정 프로세스의 사용 가능한 모든 관계에 대한 검사 목록이 있습니다. 상자를 선택하면 사용자는 해당 이벤트에서 플로우 파일을 종료하고 플로우에서 더 이상 전송하지 않도록 프로세서를 프로그래밍 할 수 있습니다.
GetFile 스케줄링
이들은 GetFile 프로세서가 제공하는 다음과 같은 스케줄링 옵션입니다.
일정 전략
시간 기반을 선택하거나 CRON 드라이버 옵션을 선택하여 지정된 CRON 문자열을 선택하여 시간을 기준으로 프로세스를 예약 할 수 있습니다.
동시 작업
이 옵션은이 프로세서에 대한 동시 작업 일정을 정의하는 데 사용됩니다.
실행
사용자는이 옵션을 사용하여 모든 노드에서 프로세서를 실행할지 또는 기본 노드에서만 실행할지 정의 할 수 있습니다.
실행 일정
시간 기반 전략 또는 CRON 기반 전략의 CRON 표현에 대한 시간을 정의하는 데 사용됩니다.
GetFile 속성
GetFile은 아래 이미지와 같이 경로 필터 및 최대 파일 크기와 같은 선택적 속성에 대한 입력 디렉터리 및 파일 필터와 같은 필수 속성을 제공하는 여러 속성을 제공합니다. 사용자는 이러한 속성을 사용하여 파일 가져 오기 프로세스를 관리 할 수 있습니다.
GetFile 주석
이 섹션은 프로세서에 대한 정보를 지정하는 데 사용됩니다.
PutFile
PutFile 프로세서는 데이터 흐름에서 특정 위치로 파일을 저장하는 데 사용됩니다.
PutFile 설정
PutFile 프로세서에는 다음과 같은 설정이 있습니다.
이름
이름 설정에서 사용자는 프로젝트에 따라 또는 이름을보다 의미있게 만드는 것으로 프로세서의 이름을 정의 할 수 있습니다.
활성화
사용자는이 설정을 사용하여 프로세서를 활성화하거나 비활성화 할 수 있습니다.
페널티 기간
이 설정을 사용하면 사용자가 플로우 파일 실패시 페널티 기간을 추가 할 수 있습니다.
수율 기간
이 설정은 프로세서의 양보 시간을 지정하는 데 사용됩니다. 이 기간 동안 프로세스는 다시 예약되지 않습니다.
게시판 수준
이 설정은 해당 프로세서의 로그 수준을 지정하는 데 사용됩니다.
관계 자동 종료
이 설정에는 해당 특정 프로세스의 사용 가능한 모든 관계에 대한 검사 목록이 있습니다. 확인란을 선택하여 사용자는 해당 이벤트에서 플로우 파일을 종료하고 플로우에서 더 이상 전송하지 않도록 프로세서를 프로그래밍 할 수 있습니다.
PutFile 스케줄링
다음은 PutFile 프로세서가 제공하는 다음과 같은 스케줄링 옵션입니다.
일정 전략
타이머 구동을 선택하거나 CRON 드라이버 옵션을 선택하여 지정된 CRON 문자열을 선택하여 시간 기준으로 프로세스를 예약 할 수 있습니다. 특정 이벤트에서 프로세서를 트리거하는 실험적 전략 이벤트 기반도 있습니다.
동시 작업
이 옵션은이 프로세서에 대한 동시 작업 일정을 정의하는 데 사용됩니다.
실행
사용자는이 옵션을 사용하여 모든 노드에서 프로세서를 실행할지 또는 기본 노드에서만 실행할지를 정의 할 수 있습니다.
실행 일정
타이머 기반 전략 또는 CRON 기반 전략에 대한 CRON 표현에 대한 시간을 정의하는 데 사용됩니다.
PutFile 속성
PutFile 프로세서는 디렉토리와 같은 속성을 제공하여 파일 전송을위한 출력 디렉토리를 지정하고 기타는 아래 이미지와 같이 전송을 관리합니다.
PutFile 주석
이 섹션은 프로세서에 대한 정보를 지정하는 데 사용됩니다.