Tutorial de Impala
Impala es la base de datos analítica nativa de código abierto para Apache Hadoop. Es enviado por proveedores como Cloudera, MapR, Oracle y Amazon. Los ejemplos proporcionados en este tutorial se han desarrollado utilizando Cloudera Impala
Este tutorial está destinado a aquellos que quieran aprender a utilizar Impala. Impala se utiliza para procesar grandes volúmenes de datos a la velocidad del rayo utilizando el conocimiento tradicional de SQL.
Para aprovechar al máximo este tutorial, debe tener una buena comprensión de los conceptos básicos de los comandos de Hadoop y HDFS. También se recomienda tener un conocimiento básico de SQL antes de seguir este tutorial.