Apache Tajo - Cài đặt

Để cài đặt Apache Tajo, bạn phải có phần mềm sau trên hệ thống của mình:

  • Hadoop phiên bản 2.3 trở lên
  • Java phiên bản 1.7 trở lên
  • Linux hoặc Mac OS

Bây giờ chúng ta hãy tiếp tục với các bước sau để cài đặt Tajo.

Xác minh cài đặt Java

Hy vọng rằng bạn đã cài đặt Java phiên bản 8 trên máy của mình. Bây giờ, bạn chỉ cần tiếp tục bằng cách xác minh nó.

Để xác minh, hãy sử dụng lệnh sau:

$ java -version

Nếu Java được cài đặt thành công trên máy của bạn, bạn có thể thấy phiên bản Java hiện tại đã được cài đặt. Nếu Java chưa được cài đặt, hãy làm theo các bước sau để cài đặt Java 8 trên máy của bạn.

Tải xuống JDK

Tải xuống phiên bản mới nhất của JDK bằng cách truy cập liên kết sau và sau đó, tải xuống phiên bản mới nhất.

https://www.oracle.com

Phiên bản mới nhất là JDK 8u 92 và tập tin là “jdk-8u92-linux-x64.tar.gz”. Vui lòng tải xuống tệp trên máy của bạn. Sau đó, giải nén các tệp và chuyển chúng vào một thư mục cụ thể. Bây giờ, hãy đặt các lựa chọn thay thế Java. Cuối cùng, Java đã được cài đặt trên máy của bạn.

Xác minh cài đặt Hadoop

Bạn đã cài đặt rồi Hadooptrên hệ thống của bạn. Bây giờ, hãy xác minh nó bằng lệnh sau:

$ hadoop version

Nếu mọi thứ đều ổn với thiết lập của bạn, thì bạn có thể thấy phiên bản của Hadoop. Nếu Hadoop chưa được cài đặt, hãy tải xuống và cài đặt Hadoop bằng cách truy cập liên kết sau:https://www.apache.org

Cài đặt Apache Tajo

Apache Tajo cung cấp hai chế độ thực thi - chế độ cục bộ và chế độ phân tán hoàn toàn. Sau khi xác minh cài đặt Java và Hadoop, hãy tiến hành các bước sau để cài đặt cụm Tajo trên máy của bạn. Một phiên bản Tajo ở chế độ cục bộ yêu cầu cấu hình rất dễ dàng.

Tải xuống phiên bản mới nhất của Tajo bằng cách truy cập liên kết sau: https://www.apache.org/dyn/closer.cgi/tajo

Bây giờ bạn có thể tải xuống tệp “tajo-0.11.3.tar.gz” từ máy của bạn.

Giải nén tệp Tar

Giải nén tệp tar bằng cách sử dụng lệnh sau:

$ cd opt/ 
$ tar tajo-0.11.3.tar.gz 
$ cd tajo-0.11.3

Đặt biến môi trường

Thêm các thay đổi sau vào “conf/tajo-env.sh” tập tin

$ cd tajo-0.11.3 
$ vi conf/tajo-env.sh
 
# Hadoop home. Required 
export HADOOP_HOME = /Users/path/to/Hadoop/hadoop-2.6.2
 
# The java implementation to use.  Required. 
export JAVA_HOME = /path/to/jdk1.8.0_92.jdk/

Ở đây, bạn phải chỉ định đường dẫn Hadoop và Java đến “tajo-env.sh”tập tin. Sau khi các thay đổi được thực hiện, hãy lưu tệp và thoát khỏi thiết bị đầu cuối.

Khởi động máy chủ Tajo

Để khởi chạy máy chủ Tajo, hãy thực hiện lệnh sau:

$ bin/start-tajo.sh

Bạn sẽ nhận được phản hồi tương tự như sau:

Starting single TajoMaster 
starting master, logging to /Users/path/to/Tajo/tajo-0.11.3/bin/../ 
localhost: starting worker, logging to /Users/path/toe/Tajo/tajo-0.11.3/bin/../logs/
 
Tajo master web UI: http://local:26080 
Tajo Client Service: local:26002

Bây giờ, gõ lệnh “jps” để xem các trình duyệt đang chạy.

$ jps  
1010 TajoWorker 
1140 Jps 
933 TajoMaster

Khởi chạy Tajo Shell (Tsql)

Để khởi chạy ứng dụng khách Tajo shell, hãy sử dụng lệnh sau:

$ bin/tsql

Bạn sẽ nhận được kết quả sau:

welcome to
   _____ ___  _____ ___ 
  /_  _/ _  |/_  _/   / 
   / // /_| |_/ // / / 
  /_//_/ /_/___/ \__/  0.11.3
  
Try \? for help.

Thoát vỏ Tajo

Thực hiện lệnh sau để thoát khỏi Tsql -

default> \q 
bye!

Ở đây, mặc định đề cập đến danh mục trong Tajo.

Giao diện người dùng web

Nhập URL sau để khởi chạy giao diện người dùng web Tajo - http://localhost:26080/

Bây giờ bạn sẽ thấy màn hình sau tương tự như tùy chọn ExecuteQuery.

Dừng Tajo

Để dừng máy chủ Tajo, hãy sử dụng lệnh sau:

$ bin/stop-tajo.sh

Bạn sẽ nhận được phản hồi sau:

localhost: stopping worker 
stopping master