Учебное пособие по Spark SQL
Apache Spark - это молниеносные кластерные вычисления, предназначенные для быстрых вычислений. Он был построен на основе Hadoop MapReduce и расширяет модель MapReduce для более эффективного использования большего количества типов вычислений, включая интерактивные запросы и потоковую обработку. Это краткое руководство, в котором объясняются основы программирования Spark SQL.
Это руководство подготовлено для профессионалов, стремящихся изучить основы аналитики больших данных с помощью Spark Framework и стать разработчиком Spark. Кроме того, он будет полезен специалистам по аналитике и разработчикам ETL.
Прежде чем приступить к изучению этого руководства, мы предполагаем, что вы уже знакомы с программированием на Scala, концепциями баз данных и любыми разновидностями операционной системы Linux.