Apache Tajo Tutorial

Apache Tajo ist ein Open-Source-Framework für verteiltes Data Warehouse für Hadoop. Tajo wurde ursprünglich von Gruter, einem in Hadoop ansässigen Infrastrukturunternehmen in Südkorea, gegründet. Später trugen auch Experten von Intel, Etsy, der NASA, Cloudera und Hortonworks zum Projekt bei. Tajo bezieht sich auf einen Strauß in koreanischer Sprache. Im März 2014 erhielt Tajo ein Open-Source-Apache-Projekt auf höchstem Niveau. In diesem Tutorial werden die Grundlagen von Tajo erläutert und das Cluster-Setup, die Tajo-Shell, SQL-Abfragen und die Integration mit anderen Big-Data-Technologien erläutert. Abschließend werden einige Beispiele aufgeführt.

Bevor Sie mit diesem Lernprogramm fortfahren können, müssen Sie über fundierte Kenntnisse in Kern-Java, Linux-Betriebssystemen und DBMS verfügen.

Dieses Tutorial wurde für Fachleute erstellt, die eine Karriere in der Big-Data-Analyse anstreben. Dieses Tutorial gibt Ihnen genug Verständnis für Apache Tajo.

ja/tutorial