HBase - Arsitektur

Di HBase, tabel dibagi menjadi beberapa wilayah dan dilayani oleh server wilayah. Region dibagi secara vertikal berdasarkan kelompok kolom ke dalam "Toko". Toko disimpan sebagai file dalam HDFS. Di bawah ini adalah arsitektur HBase.

Note: Istilah 'penyimpanan' digunakan untuk wilayah untuk menjelaskan struktur penyimpanan.

HBase memiliki tiga komponen utama: perpustakaan klien, server master, dan server wilayah. Server wilayah dapat ditambahkan atau dihapus sesuai kebutuhan.

MasterServer

Server master -

  • Menetapkan wilayah ke server wilayah dan mengambil bantuan Apache ZooKeeper untuk tugas ini.

  • Menangani load balancing wilayah di seluruh server wilayah. Ini membongkar server yang sibuk dan menggeser wilayah ke server yang kurang terisi.

  • Mempertahankan status cluster dengan menegosiasikan load balancing.

  • Bertanggung jawab atas perubahan skema dan operasi metadata lainnya seperti pembuatan tabel dan keluarga kolom.

Wilayah

Wilayah tidak lain adalah tabel yang dibagi dan tersebar di seluruh server wilayah.

Server wilayah

Server wilayah memiliki wilayah yang -

  • Berkomunikasi dengan klien dan menangani operasi terkait data.
  • Menangani permintaan baca dan tulis untuk semua wilayah di bawahnya.
  • Tentukan ukuran wilayah dengan mengikuti ambang ukuran wilayah.

Ketika kita melihat lebih dalam ke server wilayah, itu berisi wilayah dan penyimpanan seperti yang ditunjukkan di bawah ini:

Toko berisi penyimpanan memori dan HFiles. Memstore seperti memori cache. Apa pun yang dimasukkan ke dalam HBase disimpan di sini pada awalnya. Nanti, data ditransfer dan disimpan di Hfiles sebagai blok dan memstore dihapus.

Penjaga kebun binatang

  • Zookeeper adalah proyek sumber terbuka yang menyediakan layanan seperti memelihara informasi konfigurasi, penamaan, menyediakan sinkronisasi terdistribusi, dll.

  • Zookeeper memiliki node sementara yang mewakili server wilayah yang berbeda. Server master menggunakan node ini untuk menemukan server yang tersedia.

  • Selain ketersediaan, node juga digunakan untuk melacak kegagalan server atau partisi jaringan.

  • Klien berkomunikasi dengan server wilayah melalui penjaga kebun binatang.

  • Dalam mode pseudo dan standalone, HBase sendiri akan mengurus zookeeper.