Apache Flink - Flink против Spark против Hadoop

Вот исчерпывающая таблица, в которой показано сравнение трех самых популярных платформ больших данных: Apache Flink, Apache Spark и Apache Hadoop.

	Apache Hadoop	Apache Spark	Apache Flink
Year of Origin	2005 г.	2009 г.	2009 г.
Place of Origin	MapReduce (Google) Hadoop (Yahoo)	Калифорнийский университет в Беркли	Технический университет Берлина
Data Processing Engine	Партия	Партия	Поток
Processing Speed	Медленнее, чем Spark and Flink	В 100 раз быстрее, чем Hadoop	Быстрее искры
Programming Languages	Java, C, C ++, Ruby, Groovy, Perl, Python	Java, Scala, python и R	Java и Scala
Programming Model	Уменьшение карты	Устойчивые распределенные наборы данных (RDD)	Циклические потоки данных
Data Transfer	Партия	Партия	Конвейерный и пакетный
Memory Management	На основе диска	Управляемая JVM	Активный управляемый
Latency	Низкий	Средняя	Низкий
Throughput	Средняя	Высоко	Высоко
Optimization	Руководство	Руководство	Автоматический
API	Низкий уровень	Высокий уровень	Высокий уровень
Streaming Support	NA	Spark Streaming	Flink Streaming
SQL Support	Улей, Импала	SparkSQL	Табличный API и SQL
Graph Support	NA	GraphX	Gelly
Machine Learning Support	NA	SparkML	FlinkML