Apache Flink-일괄 처리와 실시간 처리

빅 데이터의 경우 두 가지 유형의 처리가 있습니다.

  • 일괄 처리
  • 실시간 처리

시간이 지남에 따라 수집 된 데이터를 기반으로 한 처리를 일괄 처리라고합니다. 예를 들어, 한 은행 관리자가 지난 1 개월 동안 취소 된 수표 수를 확인하기 위해 지난 1 개월 데이터 (시간이 지남에 따라 수집 됨)를 처리하려고합니다.

즉각적인 결과를 위해 즉각적인 데이터를 기반으로 한 처리를 실시간 처리라고합니다. 예를 들어, 은행 관리자가 사기 거래 (즉시 결과)가 발생한 직후 사기 경고를받습니다.

아래 표는 일괄 처리와 실시간 처리의 차이점을 나열합니다.

일괄 처리 실시간 처리

정적 파일

이벤트 스트림

분, 시간, 일 등으로 주기적으로 처리됩니다.

즉시 처리

나노초

디스크 저장소의 과거 데이터

메모리 스토리지

예-빌 생성

예-ATM 거래 경고

요즘에는 모든 조직에서 실시간 처리가 많이 사용되고 있습니다. 사기 탐지, 의료 분야의 실시간 경고 및 네트워크 공격 경고와 같은 사용 사례에는 즉각적인 데이터의 실시간 처리가 필요합니다. 몇 밀리 초의 지연도 큰 영향을 미칠 수 있습니다.

이러한 실시간 사용 사례에 이상적인 도구는 일괄 처리가 아닌 스트림으로 데이터를 입력 할 수있는 도구입니다. Apache Flink는 실시간 처리 도구입니다.