Hướng dẫn Apache Tajo
Apache Tajo là một khung kho dữ liệu phân tán mã nguồn mở cho Hadoop. Tajo ban đầu được thành lập bởi Gruter, một công ty cơ sở hạ tầng có trụ sở tại Hadoop ở Hàn Quốc. Sau đó, các chuyên gia từ Intel, Etsy, NASA, Cloudera, Hortonworks cũng đóng góp vào dự án. Tajo dùng để chỉ một con đà điểu trong tiếng Hàn. Vào tháng 3 năm 2014, Tajo đã được cấp một dự án Apache mã nguồn mở cấp cao nhất. Hướng dẫn này sẽ khám phá những điều cơ bản về Tajo và tiếp tục, nó sẽ giải thích thiết lập cụm, Tajo shell, truy vấn SQL, tích hợp với các công nghệ dữ liệu lớn khác và cuối cùng kết luận với một số ví dụ.
Trước khi tiếp tục hướng dẫn này, bạn phải có kiến thức vững chắc về Java lõi, bất kỳ hệ điều hành Linux nào và DBMS.
Hướng dẫn này đã được chuẩn bị cho các chuyên gia mong muốn tạo dựng sự nghiệp trong lĩnh vực phân tích dữ liệu lớn. Hướng dẫn này sẽ cung cấp cho bạn đủ hiểu biết về Apache Tajo.