ApacheTajoチュートリアル

Apache Tajoは、Hadoop用のオープンソースの分散データウェアハウスフレームワークです。Tajoは当初、韓国のHadoopベースのインフラストラクチャ企業であるG​​ruterによって開始されました。その後、Intel、Etsy、NASA、Cloudera、Hortonworksの専門家もプロジェクトに貢献しました。タホは韓国語でダチョウを指します。2014年3月、TajoはトップレベルのオープンソースApacheプロジェクトを承認されました。このチュートリアルでは、Tajoの基本を探り、次に進みます。クラスターのセットアップ、Tajoシェル、SQLクエリ、他のビッグデータテクノロジーとの統合について説明し、最後にいくつかの例で締めくくります。

このチュートリアルに進む前に、コアJava、任意のLinux OS、およびDBMSに関する十分な知識が必要です。

このチュートリアルは、ビッグデータ分析でのキャリアを目指す専門家向けに作成されています。このチュートリアルでは、ApacheTajoについて十分に理解できます。