Apache Flink-빅 데이터 플랫폼

지난 10 년 동안 데이터의 발전은 엄청났습니다. 이로 인해 '빅 데이터'라는 용어가 생겼습니다. 빅 데이터라고 부를 수있는 고정 된 크기의 데이터는 없습니다. 기존 시스템 (RDBMS)이 처리 할 수없는 데이터는 빅 데이터입니다. 이 빅 데이터는 구조화, 반 구조화 또는 비 구조화 형식 일 수 있습니다. 처음에 데이터에는 볼륨, 속도, 다양성의 세 가지 차원이있었습니다. 이제 차원은 3V를 넘어 섰습니다. 이제 Veracity, Validity, Vulnerability, Value, Variability 등 다른 V를 추가했습니다.

빅 데이터는 데이터 저장 및 처리에 도움이되는 여러 도구 및 프레임 워크의 출현으로 이어졌습니다. Hadoop, Spark, Hive, Pig, Storm 및 Zookeeper와 같은 몇 가지 인기있는 빅 데이터 프레임 워크가 있습니다. 또한 의료, 금융, 소매, 전자 상거래 등과 같은 여러 도메인에서 차세대 제품을 만들 수있는 기회를 제공했습니다.

다국적 기업이든 신생 기업이든 모두가 빅 데이터를 활용하여 데이터를 저장 및 처리하고 더 현명한 결정을 내리고 있습니다.

ja/tutorial