Apache Tajo - Cài đặt
Để cài đặt Apache Tajo, bạn phải có phần mềm sau trên hệ thống của mình:
- Hadoop phiên bản 2.3 trở lên
- Java phiên bản 1.7 trở lên
- Linux hoặc Mac OS
Bây giờ chúng ta hãy tiếp tục với các bước sau để cài đặt Tajo.
Xác minh cài đặt Java
Hy vọng rằng bạn đã cài đặt Java phiên bản 8 trên máy của mình. Bây giờ, bạn chỉ cần tiếp tục bằng cách xác minh nó.
Để xác minh, hãy sử dụng lệnh sau:
$ java -version
Nếu Java được cài đặt thành công trên máy của bạn, bạn có thể thấy phiên bản Java hiện tại đã được cài đặt. Nếu Java chưa được cài đặt, hãy làm theo các bước sau để cài đặt Java 8 trên máy của bạn.
Tải xuống JDK
Tải xuống phiên bản mới nhất của JDK bằng cách truy cập liên kết sau và sau đó, tải xuống phiên bản mới nhất.
https://www.oracle.com
Phiên bản mới nhất là JDK 8u 92 và tập tin là “jdk-8u92-linux-x64.tar.gz”. Vui lòng tải xuống tệp trên máy của bạn. Sau đó, giải nén các tệp và chuyển chúng vào một thư mục cụ thể. Bây giờ, hãy đặt các lựa chọn thay thế Java. Cuối cùng, Java đã được cài đặt trên máy của bạn.
Xác minh cài đặt Hadoop
Bạn đã cài đặt rồi Hadooptrên hệ thống của bạn. Bây giờ, hãy xác minh nó bằng lệnh sau:
$ hadoop version
Nếu mọi thứ đều ổn với thiết lập của bạn, thì bạn có thể thấy phiên bản của Hadoop. Nếu Hadoop chưa được cài đặt, hãy tải xuống và cài đặt Hadoop bằng cách truy cập liên kết sau:https://www.apache.org
Cài đặt Apache Tajo
Apache Tajo cung cấp hai chế độ thực thi - chế độ cục bộ và chế độ phân tán hoàn toàn. Sau khi xác minh cài đặt Java và Hadoop, hãy tiến hành các bước sau để cài đặt cụm Tajo trên máy của bạn. Một phiên bản Tajo ở chế độ cục bộ yêu cầu cấu hình rất dễ dàng.
Tải xuống phiên bản mới nhất của Tajo bằng cách truy cập liên kết sau: https://www.apache.org/dyn/closer.cgi/tajo
Bây giờ bạn có thể tải xuống tệp “tajo-0.11.3.tar.gz” từ máy của bạn.
Giải nén tệp Tar
Giải nén tệp tar bằng cách sử dụng lệnh sau:
$ cd opt/
$ tar tajo-0.11.3.tar.gz
$ cd tajo-0.11.3
Đặt biến môi trường
Thêm các thay đổi sau vào “conf/tajo-env.sh” tập tin
$ cd tajo-0.11.3
$ vi conf/tajo-env.sh
# Hadoop home. Required
export HADOOP_HOME = /Users/path/to/Hadoop/hadoop-2.6.2
# The java implementation to use. Required.
export JAVA_HOME = /path/to/jdk1.8.0_92.jdk/
Ở đây, bạn phải chỉ định đường dẫn Hadoop và Java đến “tajo-env.sh”tập tin. Sau khi các thay đổi được thực hiện, hãy lưu tệp và thoát khỏi thiết bị đầu cuối.
Khởi động máy chủ Tajo
Để khởi chạy máy chủ Tajo, hãy thực hiện lệnh sau:
$ bin/start-tajo.sh
Bạn sẽ nhận được phản hồi tương tự như sau:
Starting single TajoMaster
starting master, logging to /Users/path/to/Tajo/tajo-0.11.3/bin/../
localhost: starting worker, logging to /Users/path/toe/Tajo/tajo-0.11.3/bin/../logs/
Tajo master web UI: http://local:26080
Tajo Client Service: local:26002
Bây giờ, gõ lệnh “jps” để xem các trình duyệt đang chạy.
$ jps
1010 TajoWorker
1140 Jps
933 TajoMaster
Khởi chạy Tajo Shell (Tsql)
Để khởi chạy ứng dụng khách Tajo shell, hãy sử dụng lệnh sau:
$ bin/tsql
Bạn sẽ nhận được kết quả sau:
welcome to
_____ ___ _____ ___
/_ _/ _ |/_ _/ /
/ // /_| |_/ // / /
/_//_/ /_/___/ \__/ 0.11.3
Try \? for help.
Thoát vỏ Tajo
Thực hiện lệnh sau để thoát khỏi Tsql -
default> \q
bye!
Ở đây, mặc định đề cập đến danh mục trong Tajo.
Giao diện người dùng web
Nhập URL sau để khởi chạy giao diện người dùng web Tajo - http://localhost:26080/
Bây giờ bạn sẽ thấy màn hình sau tương tự như tùy chọn ExecuteQuery.
Dừng Tajo
Để dừng máy chủ Tajo, hãy sử dụng lệnh sau:
$ bin/stop-tajo.sh
Bạn sẽ nhận được phản hồi sau:
localhost: stopping worker
stopping master