Apache Flink-Flink 대 Spark 대 Hadoop

다음은 가장 널리 사용되는 세 가지 빅 데이터 프레임 워크 인 Apache Flink, Apache Spark 및 Apache Hadoop 간의 비교를 보여주는 포괄적 인 표입니다.

	Apache Hadoop	Apache Spark	Apache Flink
Year of Origin	2005 년	2009 년	2009 년
Place of Origin	MapReduce (Google) Hadoop (Yahoo)	캘리포니아 대학교 버클리	베를린 기술 대학교
Data Processing Engine	일괄	일괄	흐름
Processing Speed	Spark 및 Flink보다 느림	Hadoop보다 100 배 더 빠름	스파크보다 빠름
Programming Languages	자바, C, C ++, Ruby, Groovy, Perl, Python	Java, Scala, Python 및 R	자바와 스칼라
Programming Model	MapReduce	탄력적 인 분산 데이터 세트 (RDD)	순환 데이터 흐름
Data Transfer	일괄	일괄	파이프 라인 및 배치
Memory Management	디스크 기반	JVM 관리	활성 관리
Latency	낮은	매질	낮은
Throughput	매질	높은	높은
Optimization	설명서	설명서	자동적 인
API	저수준	높은 레벨	높은 레벨
Streaming Support	NA	스파크 스트리밍	Flink 스트리밍
SQL Support	하이브, 임팔라	SparkSQL	테이블 API 및 SQL
Graph Support	NA	GraphX	젤리
Machine Learning Support	NA	SparkML	FlinkML