Data Warehousing - Backup

Gudang data adalah sistem yang kompleks dan berisi data dalam jumlah besar. Oleh karena itu, penting untuk membuat cadangan semua data agar tersedia untuk pemulihan di masa mendatang sesuai kebutuhan. Pada bab ini, kita akan membahas masalah dalam merancang strategi cadangan.

Terminologi Cadangan

Sebelum melangkah lebih jauh, Anda harus mengetahui beberapa terminologi cadangan yang dibahas di bawah ini.

  • Complete backup- Ini mencadangkan seluruh database pada saat yang bersamaan. Cadangan ini mencakup semua file database, file kontrol, dan file jurnal.

  • Partial backup- Seperti namanya, ini tidak membuat cadangan lengkap dari database. Cadangan parsial sangat berguna dalam basis data besar karena memungkinkan strategi di mana berbagai bagian basis data dicadangkan secara round-robin setiap hari, sehingga seluruh basis data dicadangkan secara efektif seminggu sekali.

  • Cold backup- Cadangan dingin diambil saat database benar-benar dimatikan. Dalam lingkungan multi-instans, semua instans harus ditutup.

  • Hot backup- Hot backup diambil saat mesin database aktif dan berjalan. Persyaratan cadangan panas bervariasi dari RDBMS hingga RDBMS.

  • Online backup - Ini sangat mirip dengan cadangan panas.

Pencadangan Perangkat Keras

Penting untuk memutuskan perangkat keras mana yang akan digunakan untuk pencadangan. Kecepatan pemrosesan pencadangan dan pemulihan bergantung pada perangkat keras yang digunakan, cara menghubungkan perangkat keras, bandwidth jaringan, perangkat lunak pencadangan, dan kecepatan sistem I / O server. Disini kita akan membahas beberapa pilihan hardware yang tersedia beserta kelebihan dan kekurangannya. Pilihannya adalah sebagai berikut -

  • Teknologi Pita
  • Cadangan Disk

Teknologi Pita

Pilihan rekaman dapat dikategorikan sebagai berikut -

  • Media tape
  • Penggerak pita mandiri
  • Penumpuk pita
  • Silo selotip

Tape Media

Ada beberapa jenis media tape. Beberapa standar media tape tercantum dalam tabel di bawah ini -

Media Pita Kapasitas Tarif I / O
DLT 40 GB 3 MB / dtk
3490e 1,6 GB 3 MB / dtk
8 mm 14 GB 1 MB / dtk

Faktor lain yang perlu diperhatikan adalah sebagai berikut -

  • Keandalan media rekaman
  • Biaya media tape per unit
  • Scalability
  • Biaya upgrade ke sistem tape
  • Biaya media tape per unit
  • Umur simpan media tape

Standalone Tape Drives

Drive tape dapat dihubungkan dengan cara berikut -

  • Langsung ke server
  • Sebagai perangkat jaringan yang tersedia
  • Dari jarak jauh ke mesin lain

Mungkin ada masalah dalam menghubungkan tape drive ke gudang data.

  • Pertimbangkan server adalah mesin MPP 48node. Kami tidak tahu node untuk menghubungkan tape drive dan kami tidak tahu bagaimana menyebarkannya ke node server untuk mendapatkan kinerja yang optimal dengan gangguan server yang paling sedikit dan latensi I / O internal yang paling sedikit.

  • Menghubungkan tape drive sebagai perangkat jaringan yang tersedia membutuhkan jaringan untuk dapat bekerja dengan kecepatan transfer data yang besar. Pastikan tersedia bandwidth yang cukup selama Anda membutuhkannya.

  • Menghubungkan tape drive dari jarak jauh juga membutuhkan bandwidth yang tinggi.

Penumpuk Pita

Metode memuat beberapa kaset ke dalam satu tape drive dikenal sebagai tape stacker. Penumpuk melepaskan pita saat ini setelah selesai dan memuat pita berikutnya, oleh karena itu hanya satu pita yang tersedia pada satu waktu untuk diakses. Harga dan kemampuannya mungkin berbeda, tetapi kemampuan umumnya adalah mereka dapat melakukan pencadangan tanpa pengawasan.

Tape Silo

Silo tape menyediakan kapasitas penyimpanan yang besar. Silo tape dapat menyimpan dan mengelola ribuan kaset. Mereka dapat mengintegrasikan beberapa tape drive. Mereka memiliki perangkat lunak dan perangkat keras untuk memberi label dan menyimpan kaset yang mereka simpan. Silo sangat umum untuk dihubungkan dari jarak jauh melalui jaringan atau tautan khusus. Kami harus memastikan bahwa bandwidth koneksi sesuai dengan pekerjaan.

Cadangan Disk

Metode cadangan disk adalah -

  • Pencadangan disk-ke-disk
  • Pemecah cermin

Metode ini digunakan dalam sistem OLTP. Metode ini meminimalkan waktu henti database dan memaksimalkan ketersediaan.

Disk-to-Disk Backups

Di sini cadangan diambil pada disk bukan di kaset. Pencadangan disk-ke-disk dilakukan karena alasan berikut -

  • Kecepatan pencadangan awal
  • Kecepatan pemulihan

Mencadangkan data dari disk ke disk jauh lebih cepat daripada ke tape. Namun ini adalah langkah cadangan perantara. Kemudian data tersebut di-backup pada rekaman itu. Keuntungan lain dari cadangan disk-ke-disk adalah memberikan Anda salinan online dari cadangan terbaru.

Mirror Breaking

Idenya adalah memiliki cakram yang dicerminkan untuk ketahanan selama hari kerja. Saat pencadangan diperlukan, salah satu set cermin dapat dipecah. Teknik ini merupakan varian dari cadangan disk-ke-disk.

Note - Basis data mungkin perlu ditutup untuk menjamin konsistensi cadangan.

Jukebox Optik

Kotak musik optik memungkinkan data disimpan di dekat garis. Teknik ini memungkinkan sejumlah besar disk optik untuk dikelola dengan cara yang sama seperti tape stacker atau tape silo. Kelemahan dari teknik ini adalah kecepatan tulisnya lebih lambat daripada disk. Tetapi media optik memberikan umur panjang dan keandalan yang menjadikannya pilihan media yang baik untuk pengarsipan.

Cadangan Perangkat Lunak

Ada alat perangkat lunak yang tersedia yang membantu dalam proses pencadangan. Alat perangkat lunak ini datang sebagai satu paket. Alat ini tidak hanya mengambil cadangan, tetapi juga dapat mengelola dan mengontrol strategi pencadangan secara efektif. Ada banyak paket perangkat lunak yang tersedia di pasaran. Beberapa dari mereka tercantum dalam tabel berikut -

Nama paket Penjaja
Networker Legato
ADSM IBM
Masa Sistem Epoch
Omniback II HP
Alexandria Sequent

Kriteria Memilih Paket Perangkat Lunak

Kriteria untuk memilih paket perangkat lunak terbaik tercantum di bawah ini -

  • Seberapa skalabel produk saat tape drive ditambahkan?
  • Apakah paket memiliki opsi klien-server, atau harus dijalankan di server database itu sendiri?
  • Akankah itu bekerja di lingkungan cluster dan MPP?
  • Tingkat paralelisme apa yang dibutuhkan?
  • Platform apa yang didukung oleh paket ini?
  • Apakah paket mendukung akses mudah ke informasi tentang isi kaset?
  • Apakah database paket tahu?
  • Apa tape drive dan media tape yang didukung oleh paket?