데이터웨어 하우징-백업
데이터웨어 하우스는 복잡한 시스템이며 엄청난 양의 데이터를 포함합니다. 따라서 요구 사항에 따라 향후 복구에 사용할 수 있도록 모든 데이터를 백업하는 것이 중요합니다. 이 장에서는 백업 전략 설계의 문제에 대해 설명합니다.
백업 용어
계속 진행하기 전에 아래에서 설명하는 몇 가지 백업 용어를 알아야합니다.
Complete backup− 전체 데이터베이스를 동시에 백업합니다. 이 백업에는 모든 데이터베이스 파일, 제어 파일 및 저널 파일이 포함됩니다.
Partial backup− 이름에서 알 수 있듯이 데이터베이스의 전체 백업을 생성하지는 않습니다. 부분 백업은 데이터베이스의 다양한 부분을 매일 라운드 로빈 방식으로 백업하여 전체 데이터베이스를 일주일에 한 번 효과적으로 백업하는 전략을 허용하기 때문에 대규모 데이터베이스에서 매우 유용합니다.
Cold backup− 데이터베이스가 완전히 종료 된 상태에서 콜드 백업을 수행합니다. 다중 인스턴스 환경에서는 모든 인스턴스를 종료해야합니다.
Hot backup− 데이터베이스 엔진이 실행 중일 때 핫 백업이 수행됩니다. 핫 백업의 요구 사항은 RDBMS마다 다릅니다.
Online backup − 핫 백업과 매우 유사합니다.
하드웨어 백업
백업에 사용할 하드웨어를 결정하는 것이 중요합니다. 백업 및 복원 처리 속도는 사용중인 하드웨어, 하드웨어 연결 방식, 네트워크 대역폭, 백업 소프트웨어 및 서버의 I / O 시스템 속도에 따라 다릅니다. 여기에서는 사용 가능한 일부 하드웨어 선택과 장단점에 대해 설명합니다. 이러한 선택은 다음과 같습니다-
- 테이프 기술
- 디스크 백업
테이프 기술
테이프 선택은 다음과 같이 분류 할 수 있습니다.
- 테이프 미디어
- 독립형 테이프 드라이브
- 테이프 스태커
- 테이프 사일로
Tape Media
여러 종류의 테이프 미디어가 있습니다. 일부 테이프 미디어 표준은 아래 표에 나열되어 있습니다.
테이프 미디어 | 생산 능력 | I / O 속도 |
---|---|---|
DLT | 40GB | 3MB / s |
3490e | 1.6GB | 3MB / s |
8mm | 14GB | 1MB / s |
고려해야 할 다른 요소는 다음과 같습니다.
- 테이프 매체의 신뢰성
- 단위당 테이프 미디어 비용
- Scalability
- 테이프 시스템으로의 업그레이드 비용
- 단위당 테이프 미디어 비용
- 테이프 매체의 유효 기간
Standalone Tape Drives
테이프 드라이브는 다음과 같은 방법으로 연결할 수 있습니다.
- 서버로 직접
- 네트워크 사용 가능 장치로
- 다른 컴퓨터에 원격으로
테이프 드라이브를 데이터웨어 하우스에 연결하는 데 문제가있을 수 있습니다.
서버가 48 노드 MPP 기계라고 가정하십시오. 테이프 드라이브를 연결할 노드를 알지 못하며 서버 중단을 최소화하고 내부 I / O 대기 시간을 최소화하면서 최적의 성능을 얻기 위해이를 서버 노드에 분산시키는 방법을 모릅니다.
테이프 드라이브를 네트워크 사용 가능 장치로 연결하려면 네트워크가 엄청난 데이터 전송 속도를 충족해야합니다. 필요한 시간 동안 충분한 대역폭을 사용할 수 있는지 확인하십시오.
테이프 드라이브를 원격으로 연결하려면 높은 대역폭이 필요합니다.
테이프 스태커
여러 테이프를 단일 테이프 드라이브에로드하는 방법을 테이프 스태커라고합니다. 스태커는 현재 테이프가 완료되면 마운트를 해제하고 다음 테이프를로드하므로 한 번에 하나의 테이프 만 액세스 할 수 있습니다. 가격과 기능은 다를 수 있지만 일반적인 기능은 무인 백업을 수행 할 수 있다는 것입니다.
테이프 사일로
테이프 사일로는 대용량 저장 용량을 제공합니다. 테이프 사일로는 수천 개의 테이프를 저장하고 관리 할 수 있습니다. 여러 테이프 드라이브를 통합 할 수 있습니다. 그들은 그들이 저장하는 테이프에 라벨을 붙이고 저장하는 소프트웨어와 하드웨어를 가지고 있습니다. 사일로가 네트워크 또는 전용 링크를 통해 원격으로 연결되는 것은 매우 일반적입니다. 연결 대역폭이 작업에 맞는지 확인해야합니다.
디스크 백업
디스크 백업 방법은 다음과 같습니다.
- 디스크 간 백업
- 거울 깨기
이러한 방법은 OLTP 시스템에서 사용됩니다. 이러한 방법은 데이터베이스 다운 타임을 최소화하고 가용성을 최대화합니다.
Disk-to-Disk Backups
여기서 백업은 테이프가 아니라 디스크에서 수행됩니다. 디스크 간 백업은 다음과 같은 이유로 수행됩니다.
- 초기 백업 속도
- 복원 속도
디스크에서 디스크로 데이터를 백업하는 것이 테이프보다 훨씬 빠릅니다. 그러나 백업의 중간 단계입니다. 나중에 데이터가 테이프에 백업됩니다. 디스크 간 백업의 또 다른 장점은 최신 백업의 온라인 복사본을 제공한다는 것입니다.
Mirror Breaking
아이디어는 근무일 동안 복원력을 위해 디스크를 미러링하는 것입니다. 백업이 필요한 경우 미러 세트 중 하나를 분리 할 수 있습니다. 이 기술은 디스크 간 백업의 변형입니다.
Note − 백업의 일관성을 보장하기 위해 데이터베이스를 종료해야 할 수 있습니다.
광학 주크 박스
광학 주크 박스를 사용하면 데이터를 니어 라인에 저장할 수 있습니다. 이 기술을 사용하면 테이프 스태커 또는 테이프 사일로와 동일한 방식으로 많은 광 디스크를 관리 할 수 있습니다. 이 기술의 단점은 디스크보다 쓰기 속도가 느리다는 것입니다. 그러나 광학 미디어는 수명이 길고 신뢰성이 높아 보관 용 미디어로 적합합니다.
소프트웨어 백업
백업 프로세스에 도움이되는 소프트웨어 도구가 있습니다. 이러한 소프트웨어 도구는 패키지로 제공됩니다. 이러한 도구는 백업을 수행 할뿐만 아니라 백업 전략을 효과적으로 관리하고 제어 할 수 있습니다. 시장에는 많은 소프트웨어 패키지가 있습니다. 그들 중 일부는 다음 표에 나열되어 있습니다.
패키지 이름 | 공급 업체 |
---|---|
Networker | Legato |
ADSM | IBM |
시대 | Epoch 시스템 |
옴니 백 II | HP |
알렉산드리아 | 순차 |
소프트웨어 패키지 선택 기준
최고의 소프트웨어 패키지를 선택하는 기준은 다음과 같습니다.
- 테이프 드라이브가 추가 될 때 제품의 확장 성은 얼마나됩니까?
- 패키지에 클라이언트-서버 옵션이 있습니까? 아니면 데이터베이스 서버 자체에서 실행되어야합니까?
- 클러스터 및 MPP 환경에서 작동합니까?
- 어느 정도의 병렬 처리가 필요합니까?
- 이 패키지는 어떤 플랫폼을 지원합니까?
- 패키지가 테이프 내용에 대한 정보에 쉽게 액세스 할 수 있도록 지원합니까?
- 패키지 데이터베이스가 인식합니까?
- 패키지에서 지원하는 테이프 드라이브 및 테이프 미디어는 무엇입니까?