Tutoriel Spark SQL
Apache Spark est un cluster de calcul ultra-rapide conçu pour des calculs rapides. Il a été construit sur Hadoop MapReduce et étend le modèle MapReduce pour utiliser efficacement plus de types de calculs, y compris les requêtes interactives et le traitement de flux. Il s'agit d'un bref didacticiel qui explique les bases de la programmation Spark SQL.
Ce didacticiel a été préparé pour les professionnels souhaitant apprendre les bases de l'analyse de Big Data à l'aide de Spark Framework et devenir un développeur Spark. En outre, il serait également utile pour les professionnels de l'analytique et les développeurs ETL.
Avant de commencer ce didacticiel, nous supposons que vous avez déjà été familiarisé avec la programmation Scala, les concepts de base de données et toutes les variantes du système d'exploitation Linux.