데이터웨어 하우징-데이터 마팅
데이터 마트가 필요한 이유
다음은 데이터 마트를 만드는 이유입니다.
부과하기 위해 데이터를 분할하려면 access control strategies.
스캔 할 데이터의 양을 줄여 쿼리 속도를 높입니다.
데이터를 다른 하드웨어 플랫폼으로 분할합니다.
사용자 액세스 도구에 적합한 형식으로 데이터를 구조화합니다.
Note− 데이터 마팅의 운영 비용이 매우 높을 수 있으므로 다른 이유로 데이터 마트를 사용하지 마십시오. 데이터 마팅 전에 데이터 마팅 전략이 특정 솔루션에 적합한 지 확인하십시오.
비용 효율적인 데이터 마팅
데이터 마팅을 비용 효율적으로 만들려면 아래 단계를 따르십시오.
- 기능적 분할 식별
- 사용자 액세스 도구 요구 사항 식별
- 액세스 제어 문제 식별
기능적 분할 식별
이 단계에서는 조직에 자연스러운 기능 분할이 있는지 확인합니다. 부서별 분할을 찾고 부서가 정보를 사용하는 방식이 나머지 조직과 격리되는 경향이 있는지 확인합니다. 예를 들어 보겠습니다.
각 판매자가 제품 그룹의 판매를 극대화 할 책임이있는 소매 조직을 고려하십시오. 이를 위해 다음은 귀중한 정보입니다.
- 매일 판매 거래
- 매주 판매 예측
- 매일 재고 위치
- 일일 주식 움직임
판매자가 취급하지 않는 제품에 관심이 없기 때문에 데이터 마팅은 관심 제품 그룹이 다루는 데이터의 하위 집합입니다. 다음 다이어그램은 여러 사용자에 대한 데이터 마팅을 보여줍니다.
기능적 분할을 결정하는 동안 고려해야 할 문제는 다음과 같습니다.
부서의 구조가 변경 될 수 있습니다.
제품이 한 부서에서 다른 부서로 전환 될 수 있습니다.
상인은 다른 제품의 판매 추세를 쿼리하여 판매 상황을 분석 할 수 있습니다.
Note − 우리는 데이터 마트 사용의 비즈니스 이점과 기술적 타당성을 결정해야합니다.
사용자 액세스 도구 요구 사항 식별
지원할 데이터 마트가 필요합니다. user access tools내부 데이터 구조가 필요합니다. 이러한 구조의 데이터는 데이터웨어 하우스의 통제를 벗어나지 만 정기적으로 채워지고 업데이트되어야합니다.
소스 시스템에서 직접 채우는 일부 도구가 있지만 일부는 그렇지 않습니다. 따라서 향후 도구의 범위를 벗어난 추가 요구 사항을 식별해야합니다.
Note − 모든 액세스 도구에서 데이터의 일관성을 보장하기 위해 데이터는 데이터웨어 하우스에서 직접 채워서는 안되며 각 도구에는 자체 데이터 마트가 있어야합니다.
액세스 제어 문제 식별
권한이있는 사용자 만 데이터에 액세스 할 수 있도록 개인 정보 보호 규칙이 있어야합니다. 예를 들어 소매 금융 기관의 데이터웨어 하우스는 모든 계정이 동일한 법인에 속하도록 보장합니다. 개인 정보 보호법은 특정 은행이 소유하지 않은 정보에 대한 액세스를 완전히 차단하도록 강제 할 수 있습니다.
데이터 마트를 사용하면 데이터웨어 하우스 내에서 데이터 세그먼트를 물리적으로 분리하여 완전한 벽을 구축 할 수 있습니다. 가능한 개인 정보 문제를 방지하기 위해 데이터웨어 하우스에서 자세한 데이터를 제거 할 수 있습니다. 각 법인에 대한 데이터 마트를 생성하고 상세한 계정 데이터와 함께 데이터웨어 하우스를 통해로드 할 수 있습니다.
데이터 마트 설계
데이터 마트는 데이터웨어 하우스 내에서 더 작은 버전의 스타 플레이크 스키마로 설계되어야하며 데이터웨어 하우스의 데이터베이스 설계와 일치해야합니다. 데이터베이스 인스턴스에 대한 제어를 유지하는 데 도움이됩니다.
요약은 데이터웨어 하우스 내에서 설계된 것과 동일한 방식으로 데이터가 마팅됩니다. 요약 테이블은 스타 플레이크 스키마의 모든 차원 데이터를 활용하는 데 도움이됩니다.
데이터 마팅 비용
데이터 마팅에 대한 비용 측정은 다음과 같습니다.
- 하드웨어 및 소프트웨어 비용
- 네트워크 액세스
- 시간 창 제약
하드웨어 및 소프트웨어 비용
데이터 마트는 동일한 하드웨어에서 생성되지만 추가 하드웨어 및 소프트웨어가 필요합니다. 사용자 쿼리를 처리하려면 추가 처리 능력과 디스크 스토리지가 필요합니다. 데이터웨어 하우스 내에 세부 데이터와 데이터 마트가있는 경우 복제 된 데이터를 저장하고 관리하는 데 추가 비용이 발생합니다.
Note − 데이터 마팅은 집계보다 비용이 많이들므로 대체 전략이 아닌 추가 전략으로 사용해야합니다.
네트워크 액세스
데이터 마트는 데이터웨어 하우스와 다른 위치에있을 수 있으므로 LAN 또는 WAN이 내부에서 전송되는 데이터 볼륨을 처리 할 수 있는지 확인해야합니다. data mart load process.
시간 창 제약
데이터 마트로드 프로세스가 사용 가능한 시간 창을 차지하는 정도는 변환의 복잡성과 제공되는 데이터 볼륨에 따라 다릅니다. 가능한 데이터 마트의 수는 다음에 따라 결정됩니다.
- 네트워크 용량.
- 사용 가능한 시간 창
- 전송되는 데이터의 양
- 데이터 마트에 데이터를 삽입하는 데 사용되는 메커니즘