데이터웨어 하우징-프로세스 관리자
프로세스 관리자는 데이터웨어 하우스 안팎으로의 데이터 흐름을 유지 관리 할 책임이 있습니다. 프로세스 관리자에는 세 가지 유형이 있습니다.
- 부하 관리자
- 창고 관리자
- 쿼리 관리자
데이터웨어 하우스로드 관리자
로드 관리자는 데이터를 추출하고 데이터베이스로로드하는 데 필요한 작업을 수행합니다. 로드 관리자의 크기와 복잡성은 데이터웨어 하우스마다 다른 솔루션에 따라 다릅니다.
로드 관리자 아키텍처
로드 관리자는 다음 기능을 수행합니다.
소스 시스템에서 데이터를 추출합니다.
추출 된 데이터를 임시 데이터 저장소에 빠르게로드합니다.
데이터웨어 하우스의 구조와 유사한 구조로 간단한 변환을 수행합니다.
소스에서 데이터 추출
데이터는 운영 데이터베이스 또는 외부 정보 제공자로부터 추출됩니다. 게이트웨이는 데이터를 추출하는 데 사용되는 응용 프로그램입니다. 기본 DBMS에 의해 지원되며 클라이언트 프로그램이 서버에서 실행할 SQL을 생성 할 수 있습니다. ODBC (Open Database Connection) 및 JDBC (Java Database Connection)는 게이트웨이의 예입니다.
빠른로드
총로드 창을 최소화하려면 가능한 가장 빠른 시간에 데이터를웨어 하우스에로드해야합니다.
변환은 데이터 처리 속도에 영향을줍니다.
변환 및 검사를 적용하기 전에 관계형 데이터베이스에 데이터를로드하는 것이 더 효과적입니다.
게이트웨이 기술은 대용량 데이터가 관련 될 때 비효율적이기 때문에 적합하지 않습니다.
간단한 변환
로드하는 동안 간단한 변환을 수행해야 할 수 있습니다. 간단한 변환을 완료 한 후 복잡한 검사를 수행 할 수 있습니다. EPOS 판매 트랜잭션을로드한다고 가정하고 다음 확인을 수행해야합니다.
- 창고 내에서 필요하지 않은 모든 컬럼을 제거하십시오.
- 모든 값을 필수 데이터 유형으로 변환하십시오.
창고 관리자
창고 관리자는 창고 관리 프로세스를 담당합니다. 타사 시스템 소프트웨어, C 프로그램 및 셸 스크립트로 구성됩니다. 창고 관리자의 규모와 복잡성은 특정 솔루션에 따라 다릅니다.
창고 관리자 아키텍처
창고 관리자는 다음을 포함합니다-
- 통제 과정
- 저장 프로 시저 또는 SQL이있는 C
- 백업 / 복구 도구
- SQL 스크립트
창고 관리자의 기능
창고 관리자는 다음과 같은 기능을 수행합니다.
일관성 및 참조 무결성 검사를 수행하기 위해 데이터를 분석합니다.
기본 데이터에 대한 인덱스, 비즈니스 뷰, 파티션 뷰를 생성합니다.
새 집계를 생성하고 기존 집계를 업데이트합니다.
정규화를 생성합니다.
임시 저장소의 소스 데이터를 게시 된 데이터웨어 하우스로 변환하고 병합합니다.
데이터웨어 하우스의 데이터를 백업합니다.
캡처 된 수명이 다한 데이터를 보관합니다.
Note −웨어 하우스 관리자는 쿼리 프로필을 분석하여 인덱스 및 집계가 적절한 지 여부를 결정합니다.
쿼리 관리자
쿼리 관리자는 쿼리를 적절한 테이블로 지정합니다. 쿼리를 적절한 테이블로 지정하여 쿼리 요청 및 응답 프로세스의 속도를 높입니다. 또한 쿼리 관리자는 사용자가 게시 한 쿼리의 실행을 예약 할 책임이 있습니다.
조회 관리자 아키텍처
쿼리 관리자는 다음 구성 요소를 포함합니다-
- C 도구 또는 RDBMS를 통한 쿼리 리디렉션
- 저장 프로 시저
- 쿼리 관리 도구
- C 도구 또는 RDBMS를 통한 쿼리 스케줄링
- 타사 소프트웨어를 통한 쿼리 예약
조회 관리자의 기능
사용자가 이해할 수있는 형태로 데이터를 제공합니다.
최종 사용자가 게시 한 쿼리의 실행을 예약합니다.
웨어 하우스 관리자가 적절한 인덱스 및 집계를 결정할 수 있도록 쿼리 프로필을 저장합니다.