Hadoopチュートリアル
Hadoopは、単純なプログラミングモデルを使用して、コンピューターのクラスター全体の分散環境でビッグデータを保存および処理できるようにするオープンソースフレームワークです。単一のサーバーから数千台のマシンにスケールアップするように設計されており、それぞれがローカルの計算とストレージを提供します。
この簡単なチュートリアルでは、ビッグデータ、MapReduceアルゴリズム、およびHadoop分散ファイルシステムについて簡単に紹介します。
このチュートリアルは、Hadoopフレームワークを使用してビッグデータ分析の基本を学び、Hadoop開発者になることを目指す専門家向けに作成されています。ソフトウェアの専門家、分析の専門家、およびETL開発者は、このコースの主な受益者です。
このチュートリアルを開始する前に、Core Java、データベースの概念、およびLinuxオペレーティングシステムのフレーバーのいずれかを事前に知っていることを前提としています。