Tutorial di Apache Tajo

Apache Tajo è un framework di data warehouse distribuito open source per Hadoop. Tajo è stato inizialmente avviato da Gruter, una società di infrastrutture con sede in Hadoop in Corea del Sud. Successivamente, hanno contribuito al progetto anche esperti di Intel, Etsy, NASA, Cloudera, Hortonworks. Tajo si riferisce a uno struzzo in lingua coreana. Nell'anno marzo 2014, Tajo ha ottenuto un progetto Apache open source di alto livello. Questo tutorial esplorerà le basi di Tajo e andando avanti, spiegherà la configurazione del cluster, la shell Tajo, le query SQL, l'integrazione con altre tecnologie di big data e infine concluderà con alcuni esempi.

Prima di procedere con questo tutorial, è necessario disporre di una solida conoscenza del core Java, di qualsiasi sistema operativo Linux e DBMS.

Questo tutorial è stato preparato per i professionisti che aspirano a fare carriera nell'analisi dei big data. Questo tutorial ti darà una comprensione sufficiente su Apache Tajo.

ja/tutorial