Apache Flink - Flink, Spark, Hadoop

En popüler üç büyük veri çerçevesi arasındaki karşılaştırmayı gösteren kapsamlı bir tablo: Apache Flink, Apache Spark ve Apache Hadoop.

Apache Hadoop Apache Spark Apache Flink

Year of Origin

2005 2009 2009

Place of Origin

MapReduce (Google) Hadoop (Yahoo) California Üniversitesi, Berkeley Berlin Teknik Üniversitesi

Data Processing Engine

Parti Parti Akış

Processing Speed

Spark ve Flink'ten daha yavaş Hadoop'tan 100 kat daha hızlı Kıvılcımdan daha hızlı

Programming Languages

Java, C, C ++, Ruby, Groovy, Perl, Python Java, Scala, python ve R Java ve Scala

Programming Model

Harita indirgeme Esnek dağıtılmış Veri Kümeleri (RDD) Döngüsel veri akışları

Data Transfer

Parti Parti Boru Hatlı ve Toplu

Memory Management

Disk Tabanlı JVM Yönetilen Aktif Yönetilen

Latency

Düşük Orta Düşük

Throughput

Orta Yüksek Yüksek

Optimization

Manuel Manuel Otomatik

API

Düşük seviye Yüksek seviye Yüksek seviye

Streaming Support

NA Kıvılcım Akışı Flink Akışı

SQL Support

Kovan, Impala SparkSQL Tablo API ve SQL

Graph Support

NA GraphX Gelly

Machine Learning Support

NA SparkML FlinkML