Apache Spark to błyskawiczne przetwarzanie klastrów zaprojektowane do szybkich obliczeń. Został zbudowany na bazie Hadoop MapReduce i rozszerza model MapReduce, aby efektywnie wykorzystywać więcej typów obliczeń, w tym zapytania interaktywne i przetwarzanie strumieniowe. To jest krótki samouczek, który wyjaśnia podstawy programowania Spark Core. 
 Ten samouczek został przygotowany dla profesjonalistów, którzy chcą poznać podstawy Big Data Analytics przy użyciu platformy Spark Framework i zostać programistą Spark. Ponadto byłby przydatny również dla specjalistów Analytics i programistów ETL. 
 Zanim zaczniesz korzystać z tego samouczka, zakładamy, że znasz już programowanie Scala, koncepcje baz danych i dowolne odmiany systemu operacyjnego Linux.

Samouczek dotyczący Apache Spark

Apache Spark - wprowadzenie

Apache Spark - RDD

Apache Spark - instalacja

Apache Spark - programowanie podstawowe

Apache Spark - wdrożenie

Zaawansowane programowanie Spark

Przydatne zasoby dotyczące Apache Spark

Apache Spark - szybki przewodnik

Dowiedz się Apache Spark