HBase - Kiến trúc

Trong HBase, các bảng được chia thành các vùng và được phục vụ bởi các máy chủ vùng. Các khu vực được chia theo chiều dọc theo họ cột thành "Cửa hàng". Các cửa hàng được lưu dưới dạng tệp trong HDFS. Hình dưới đây là kiến ​​trúc của HBase.

Note: Thuật ngữ 'cửa hàng' được sử dụng cho các khu vực để giải thích cấu trúc lưu trữ.

HBase có ba thành phần chính: thư viện máy khách, máy chủ chính và máy chủ khu vực. Máy chủ khu vực có thể được thêm vào hoặc loại bỏ theo yêu cầu.

MasterServer

Máy chủ chính -

  • Chỉ định các khu vực cho các máy chủ khu vực và nhận sự trợ giúp của Apache ZooKeeper cho nhiệm vụ này.

  • Xử lý cân bằng tải của các khu vực trên các máy chủ khu vực. Nó dỡ bỏ các máy chủ bận rộn và chuyển vùng sang các máy chủ ít bị chiếm dụng hơn.

  • Duy trì trạng thái của cụm bằng cách thỏa thuận cân bằng tải.

  • Chịu trách nhiệm về các thay đổi lược đồ và các hoạt động siêu dữ liệu khác như tạo bảng và họ cột.

Vùng

Các khu vực không là gì ngoài các bảng được chia nhỏ và trải rộng trên các máy chủ của khu vực.

Máy chủ khu vực

Máy chủ khu vực có các khu vực -

  • Giao tiếp với máy khách và xử lý các hoạt động liên quan đến dữ liệu.
  • Xử lý các yêu cầu đọc và ghi cho tất cả các vùng dưới nó.
  • Quyết định kích thước của vùng bằng cách tuân theo các ngưỡng kích thước vùng.

Khi chúng tôi xem xét sâu hơn máy chủ khu vực, nó chứa các khu vực và cửa hàng như được hiển thị bên dưới:

Kho chứa bộ nhớ lưu trữ và HFiles. Memstore chỉ giống như một bộ nhớ đệm. Bất cứ thứ gì được nhập vào HBase đều được lưu trữ ở đây ban đầu. Sau đó, dữ liệu được chuyển và lưu trong Hfiles dưới dạng khối và kho lưu trữ được xóa.

Người giữ vườn thú

  • Zookeeper là một dự án mã nguồn mở cung cấp các dịch vụ như duy trì thông tin cấu hình, đặt tên, cung cấp đồng bộ hóa phân tán, v.v.

  • Zookeeper có các nút tạm thời đại diện cho các máy chủ khu vực khác nhau. Máy chủ chính sử dụng các nút này để khám phá các máy chủ có sẵn.

  • Ngoài tính khả dụng, các nút cũng được sử dụng để theo dõi lỗi máy chủ hoặc phân vùng mạng.

  • Khách hàng giao tiếp với các máy chủ khu vực thông qua người giữ vườn.

  • Trong các chế độ giả và độc lập, bản thân HBase sẽ chăm sóc người trông coi vườn thú.