Dịch vụ web của Amazon - Redshift

Amazon Redshiftlà dịch vụ kho dữ liệu được quản lý hoàn toàn trên đám mây. Các bộ dữ liệu của nó từ 100 gigabyte đến một petabyte. Quy trình ban đầu để tạo kho dữ liệu là khởi chạy một tập hợp các tài nguyên máy tính được gọi lànodes, được tổ chức thành các nhóm được gọi là cluster. Sau đó, bạn có thể xử lý các truy vấn của mình.

Cách thiết lập Amazon Redshift?

Sau đây là các bước để thiết lập Amazon Redshift.

Step 1 - Đăng nhập và khởi chạy Redshift Cluster bằng các bước sau.

  • Đăng nhập vào bảng điều khiển AWS Management và sử dụng liên kết sau để mở bảng điều khiển Amazon Redshift - https://console.aws.amazon.com/redshift/

  • Chọn khu vực sẽ tạo cụm bằng menu Khu vực ở góc trên cùng bên phải của màn hình.

  • Nhấp vào nút Launch Cluster.

  • Trang Chi tiết Cụm sẽ mở ra. Cung cấp các chi tiết được yêu cầu và nhấp vào nút Tiếp tục cho đến trang đánh giá.

  • Một trang xác nhận sẽ mở ra. Nhấp vào nút Đóng để kết thúc để cụm đó được hiển thị trong danh sách Cụm.

  • Chọn cụm trong danh sách và xem lại thông tin Trạng thái cụm. Trang sẽ hiển thị trạng thái Cụm.

Step 2- Cấu hình nhóm bảo mật để cho phép các kết nối máy khách đến cụm. Việc cấp phép truy cập vào Redshift phụ thuộc vào việc khách hàng có ủy quyền một phiên bản EC2 hay không.

Làm theo các bước sau để nhóm bảo mật trên nền tảng EC2-VPC.

  • Mở Amazon Redshift Console và nhấp vào Cluster trên ngăn điều hướng.

  • Chọn Cụm mong muốn. Tab Cấu hình của nó sẽ mở ra.

  • Nhấp vào nhóm Bảo mật.

  • Khi trang Nhóm bảo mật mở ra, hãy nhấp vào tab Thư đến.

  • Nhấp vào nút Chỉnh sửa. Đặt các trường như hình dưới đây và nhấp vào nút Lưu.

    • Type - Quy tắc TCP tùy chỉnh.

    • Protocol - TCP.

    • Port Range- Nhập cùng một số cổng được sử dụng trong khi khởi chạy cụm. Cổng mặc định cho Amazon Redshift là 5439.

    • Source - Chọn Custom IP, sau đó gõ 0.0.0.0/0.

Step 3 - Kết nối với Redshift Cluster.

Có hai cách để kết nối với Redshift Cluster - Trực tiếp hoặc qua SSL.

Sau đây là các bước để kết nối trực tiếp.

  • Kết nối cụm bằng cách sử dụng công cụ máy khách SQL. Nó hỗ trợ các công cụ máy khách SQL tương thích với trình điều khiển PostgreSQL JDBC hoặc ODBC.

    Sử dụng các liên kết sau để tải xuống - JDBC https://jdbc.postgresql.org/download/postgresql-8.4-703.jdbc4.jar

    ODBC https://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_08_04_0200.zip hoặc http://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_09_00_0101x64.zip cho máy 64 bit

  • Sử dụng các bước sau để lấy Chuỗi kết nối.

    • Mở Amazon Redshift Console và chọn Cụm trong ngăn Điều hướng.

    • Chọn nhóm lựa chọn và nhấp vào tab Cấu hình.

    • Một trang mở ra như được hiển thị trong ảnh chụp màn hình sau với URL JDBC trong Thuộc tính cơ sở dữ liệu cụm. Sao chép URL.

  • Sử dụng các bước sau để kết nối Cụm với SQL Workbench / J.

    • Mở SQL Workbench / J.

    • Chọn Tệp và nhấp vào cửa sổ Kết nối.

    • Chọn Tạo cấu hình kết nối mới và điền các chi tiết cần thiết như tên, v.v.

    • Nhấp vào Quản lý trình điều khiển và hộp thoại Quản lý trình điều khiển sẽ mở ra.

    • Nhấp vào nút Tạo mục nhập mới và điền các chi tiết cần thiết.

  • Nhấp vào biểu tượng thư mục và điều hướng đến vị trí trình điều khiển. Cuối cùng, nhấp vào nút Mở.

  • Để trống hộp Tên lớp và hộp URL Mẫu. Bấm OK.

  • Chọn Trình điều khiển từ danh sách.

  • Trong trường URL, hãy dán URL JDBC đã sao chép.

  • Nhập tên người dùng và mật khẩu vào các trường tương ứng.

  • Chọn hộp Tự động gửi và nhấp vào Lưu danh sách hồ sơ.

Đặc điểm của Amazon Redshift

Sau đây là các tính năng của Amazon Redshift -

  • Supports VPC - Người dùng có thể khởi chạy Redshift trong VPC và kiểm soát quyền truy cập vào cụm thông qua môi trường mạng ảo.

  • Encryption - Dữ liệu được lưu trữ trong Redshift có thể được mã hóa và cấu hình trong khi tạo bảng trong Redshift.

  • SSL - Mã hóa SSL được sử dụng để mã hóa kết nối giữa các máy khách và Redshift.

  • Scalable- Với một vài cú nhấp chuột đơn giản, số lượng nút có thể dễ dàng được mở rộng trong kho dữ liệu Redshift của bạn theo yêu cầu. Nó cũng cho phép mở rộng dung lượng lưu trữ mà không làm giảm hiệu suất.

  • Cost-effective- Amazon Redshift là một giải pháp thay thế hiệu quả về chi phí cho các phương thức lưu trữ dữ liệu truyền thống. Không có chi phí trả trước, không có cam kết dài hạn và cơ cấu giá theo yêu cầu.