Apache Flink - Flink, Spark, Hadoop
En popüler üç büyük veri çerçevesi arasındaki karşılaştırmayı gösteren kapsamlı bir tablo: Apache Flink, Apache Spark ve Apache Hadoop.
Apache Hadoop | Apache Spark | Apache Flink | |
---|---|---|---|
Year of Origin |
2005 | 2009 | 2009 |
Place of Origin |
MapReduce (Google) Hadoop (Yahoo) | California Üniversitesi, Berkeley | Berlin Teknik Üniversitesi |
Data Processing Engine |
Parti | Parti | Akış |
Processing Speed |
Spark ve Flink'ten daha yavaş | Hadoop'tan 100 kat daha hızlı | Kıvılcımdan daha hızlı |
Programming Languages |
Java, C, C ++, Ruby, Groovy, Perl, Python | Java, Scala, python ve R | Java ve Scala |
Programming Model |
Harita indirgeme | Esnek dağıtılmış Veri Kümeleri (RDD) | Döngüsel veri akışları |
Data Transfer |
Parti | Parti | Boru Hatlı ve Toplu |
Memory Management |
Disk Tabanlı | JVM Yönetilen | Aktif Yönetilen |
Latency |
Düşük | Orta | Düşük |
Throughput |
Orta | Yüksek | Yüksek |
Optimization |
Manuel | Manuel | Otomatik |
API |
Düşük seviye | Yüksek seviye | Yüksek seviye |
Streaming Support |
NA | Kıvılcım Akışı | Flink Akışı |
SQL Support |
Kovan, Impala | SparkSQL | Tablo API ve SQL |
Graph Support |
NA | GraphX | Gelly |
Machine Learning Support |
NA | SparkML | FlinkML |