Apache Flink - Flink vs Spark vs Hadoop

Ecco una tabella completa, che mostra il confronto tra i tre framework di big data più popolari: Apache Flink, Apache Spark e Apache Hadoop.

	Apache Hadoop	Apache Spark	Apache Flink
Year of Origin	2005	2009	2009
Place of Origin	MapReduce (Google) Hadoop (Yahoo)	Università della California, Berkeley	Università Tecnica di Berlino
Data Processing Engine	Lotto	Lotto	Stream
Processing Speed	Più lento di Spark e Flink	100 volte più veloce di Hadoop	Più veloce della scintilla
Programming Languages	Java, C, C ++, Ruby, Groovy, Perl, Python	Java, Scala, Python e R	Java e Scala
Programming Model	Riduci mappa	Set di dati distribuiti resilienti (RDD)	Flussi di dati ciclici
Data Transfer	Lotto	Lotto	Pipelined e batch
Memory Management	Basato su disco	Gestito da JVM	Gestito attivo
Latency	Basso	medio	Basso
Throughput	medio	Alto	Alto
Optimization	Manuale	Manuale	Automatico
API	Basso livello	Alto livello	Alto livello
Streaming Support	N / A	Spark Streaming	Flink Streaming
SQL Support	Alveare, Impala	SparkSQL	Tabella API e SQL
Graph Support	N / A	GraphX	Gelly
Machine Learning Support	N / A	SparkML	FlinkML