ApacheFlumeチュートリアル
Flumeは、さまざまなデータプロデューサー(Webサーバー)からHadoopにデータを取り込むための、標準的でシンプル、堅牢、柔軟、かつ拡張可能なツールです。このチュートリアルでは、Apache Flumeの基本と実際の使用方法を説明するために、簡単で説明的な例を使用します。
このチュートリアルは、ApacheFlumeを使用してさまざまなWebサーバーからHDFSまたはHBaseにログとストリーミングデータを転送するプロセスを学びたいすべての専門家を対象としています。
このチュートリアルを最大限に活用するには、HadoopおよびHDFSコマンドの基本を十分に理解している必要があります。