Data Warehousing - Backup
Gudang data adalah sistem yang kompleks dan berisi data dalam jumlah besar. Oleh karena itu, penting untuk membuat cadangan semua data agar tersedia untuk pemulihan di masa mendatang sesuai kebutuhan. Pada bab ini, kita akan membahas masalah dalam merancang strategi cadangan.
Terminologi Cadangan
Sebelum melangkah lebih jauh, Anda harus mengetahui beberapa terminologi cadangan yang dibahas di bawah ini.
Complete backup- Ini mencadangkan seluruh database pada saat yang bersamaan. Cadangan ini mencakup semua file database, file kontrol, dan file jurnal.
Partial backup- Seperti namanya, ini tidak membuat cadangan lengkap dari database. Cadangan parsial sangat berguna dalam basis data besar karena memungkinkan strategi di mana berbagai bagian basis data dicadangkan secara round-robin setiap hari, sehingga seluruh basis data dicadangkan secara efektif seminggu sekali.
Cold backup- Cadangan dingin diambil saat database benar-benar dimatikan. Dalam lingkungan multi-instans, semua instans harus ditutup.
Hot backup- Hot backup diambil saat mesin database aktif dan berjalan. Persyaratan cadangan panas bervariasi dari RDBMS hingga RDBMS.
Online backup - Ini sangat mirip dengan cadangan panas.
Pencadangan Perangkat Keras
Penting untuk memutuskan perangkat keras mana yang akan digunakan untuk pencadangan. Kecepatan pemrosesan pencadangan dan pemulihan bergantung pada perangkat keras yang digunakan, cara menghubungkan perangkat keras, bandwidth jaringan, perangkat lunak pencadangan, dan kecepatan sistem I / O server. Disini kita akan membahas beberapa pilihan hardware yang tersedia beserta kelebihan dan kekurangannya. Pilihannya adalah sebagai berikut -
- Teknologi Pita
- Cadangan Disk
Teknologi Pita
Pilihan rekaman dapat dikategorikan sebagai berikut -
- Media tape
- Penggerak pita mandiri
- Penumpuk pita
- Silo selotip
Tape Media
Ada beberapa jenis media tape. Beberapa standar media tape tercantum dalam tabel di bawah ini -
Media Pita | Kapasitas | Tarif I / O |
---|---|---|
DLT | 40 GB | 3 MB / dtk |
3490e | 1,6 GB | 3 MB / dtk |
8 mm | 14 GB | 1 MB / dtk |
Faktor lain yang perlu diperhatikan adalah sebagai berikut -
- Keandalan media rekaman
- Biaya media tape per unit
- Scalability
- Biaya upgrade ke sistem tape
- Biaya media tape per unit
- Umur simpan media tape
Standalone Tape Drives
Drive tape dapat dihubungkan dengan cara berikut -
- Langsung ke server
- Sebagai perangkat jaringan yang tersedia
- Dari jarak jauh ke mesin lain
Mungkin ada masalah dalam menghubungkan tape drive ke gudang data.
Pertimbangkan server adalah mesin MPP 48node. Kami tidak tahu node untuk menghubungkan tape drive dan kami tidak tahu bagaimana menyebarkannya ke node server untuk mendapatkan kinerja yang optimal dengan gangguan server yang paling sedikit dan latensi I / O internal yang paling sedikit.
Menghubungkan tape drive sebagai perangkat jaringan yang tersedia membutuhkan jaringan untuk dapat bekerja dengan kecepatan transfer data yang besar. Pastikan tersedia bandwidth yang cukup selama Anda membutuhkannya.
Menghubungkan tape drive dari jarak jauh juga membutuhkan bandwidth yang tinggi.
Penumpuk Pita
Metode memuat beberapa kaset ke dalam satu tape drive dikenal sebagai tape stacker. Penumpuk melepaskan pita saat ini setelah selesai dan memuat pita berikutnya, oleh karena itu hanya satu pita yang tersedia pada satu waktu untuk diakses. Harga dan kemampuannya mungkin berbeda, tetapi kemampuan umumnya adalah mereka dapat melakukan pencadangan tanpa pengawasan.
Tape Silo
Silo tape menyediakan kapasitas penyimpanan yang besar. Silo tape dapat menyimpan dan mengelola ribuan kaset. Mereka dapat mengintegrasikan beberapa tape drive. Mereka memiliki perangkat lunak dan perangkat keras untuk memberi label dan menyimpan kaset yang mereka simpan. Silo sangat umum untuk dihubungkan dari jarak jauh melalui jaringan atau tautan khusus. Kami harus memastikan bahwa bandwidth koneksi sesuai dengan pekerjaan.
Cadangan Disk
Metode cadangan disk adalah -
- Pencadangan disk-ke-disk
- Pemecah cermin
Metode ini digunakan dalam sistem OLTP. Metode ini meminimalkan waktu henti database dan memaksimalkan ketersediaan.
Disk-to-Disk Backups
Di sini cadangan diambil pada disk bukan di kaset. Pencadangan disk-ke-disk dilakukan karena alasan berikut -
- Kecepatan pencadangan awal
- Kecepatan pemulihan
Mencadangkan data dari disk ke disk jauh lebih cepat daripada ke tape. Namun ini adalah langkah cadangan perantara. Kemudian data tersebut di-backup pada rekaman itu. Keuntungan lain dari cadangan disk-ke-disk adalah memberikan Anda salinan online dari cadangan terbaru.
Mirror Breaking
Idenya adalah memiliki cakram yang dicerminkan untuk ketahanan selama hari kerja. Saat pencadangan diperlukan, salah satu set cermin dapat dipecah. Teknik ini merupakan varian dari cadangan disk-ke-disk.
Note - Basis data mungkin perlu ditutup untuk menjamin konsistensi cadangan.
Jukebox Optik
Kotak musik optik memungkinkan data disimpan di dekat garis. Teknik ini memungkinkan sejumlah besar disk optik untuk dikelola dengan cara yang sama seperti tape stacker atau tape silo. Kelemahan dari teknik ini adalah kecepatan tulisnya lebih lambat daripada disk. Tetapi media optik memberikan umur panjang dan keandalan yang menjadikannya pilihan media yang baik untuk pengarsipan.
Cadangan Perangkat Lunak
Ada alat perangkat lunak yang tersedia yang membantu dalam proses pencadangan. Alat perangkat lunak ini datang sebagai satu paket. Alat ini tidak hanya mengambil cadangan, tetapi juga dapat mengelola dan mengontrol strategi pencadangan secara efektif. Ada banyak paket perangkat lunak yang tersedia di pasaran. Beberapa dari mereka tercantum dalam tabel berikut -
Nama paket | Penjaja |
---|---|
Networker | Legato |
ADSM | IBM |
Masa | Sistem Epoch |
Omniback II | HP |
Alexandria | Sequent |
Kriteria Memilih Paket Perangkat Lunak
Kriteria untuk memilih paket perangkat lunak terbaik tercantum di bawah ini -
- Seberapa skalabel produk saat tape drive ditambahkan?
- Apakah paket memiliki opsi klien-server, atau harus dijalankan di server database itu sendiri?
- Akankah itu bekerja di lingkungan cluster dan MPP?
- Tingkat paralelisme apa yang dibutuhkan?
- Platform apa yang didukung oleh paket ini?
- Apakah paket mendukung akses mudah ke informasi tentang isi kaset?
- Apakah database paket tahu?
- Apa tape drive dan media tape yang didukung oleh paket?