SAP HANA - Lược đồ trong Kho dữ liệu
Các lược đồ là mô tả logic của các bảng trong Kho dữ liệu. Các lược đồ được tạo bằng cách kết hợp nhiều bảng dữ kiện và thứ nguyên để đáp ứng một số logic nghiệp vụ.
Cơ sở dữ liệu sử dụng mô hình quan hệ để lưu trữ dữ liệu. Tuy nhiên, Data Warehouse sử dụng các Lược đồ kết hợp các thứ nguyên và bảng dữ kiện để đáp ứng logic nghiệp vụ. Có ba loại Lược đồ được sử dụng trong Kho dữ liệu -
- Lược đồ sao
- Lược đồ bông tuyết
- Lược đồ Thiên hà
Lược đồ sao
Trong Lược đồ Sao, Mỗi Thứ nguyên được kết hợp với một bảng Dữ kiện duy nhất. Mỗi Thứ nguyên chỉ được biểu thị bằng một thứ nguyên và không được chuẩn hóa thêm.
Bảng thứ nguyên chứa tập hợp các thuộc tính được sử dụng để phân tích dữ liệu.
Example - Trong ví dụ dưới đây, chúng ta có một bảng FactSales có các Khóa chính cho tất cả các bảng Dim và đo đơn vị_bán và đô_ la đã bán để phân tích.
Chúng tôi có bốn bảng Thứ nguyên - DimTime, DimItem, DimBranch, DimLocation
Mỗi bảng Thứ nguyên được kết nối với bảng Dữ kiện vì bảng Dữ kiện có Khóa chính cho mỗi Bảng thứ nguyên được sử dụng để nối hai bảng.
Dữ kiện / Phép đo trong Bảng dữ kiện được sử dụng cho mục đích phân tích cùng với thuộc tính trong bảng Thứ nguyên.
Lược đồ bông tuyết
Trong lược đồ Snowflakes, một số bảng Thứ nguyên còn xa hơn, bảng chuẩn hóa và bảng Dim được kết nối với một Bảng dữ kiện. Chuẩn hóa được sử dụng để tổ chức các thuộc tính và bảng của cơ sở dữ liệu nhằm giảm thiểu sự dư thừa dữ liệu.
Chuẩn hóa liên quan đến việc chia một bảng thành các bảng nhỏ hơn dư thừa hơn mà không làm mất bất kỳ thông tin nào và các bảng nhỏ hơn được nối với bảng Thứ nguyên.
Trong ví dụ trên, bảng DimItem và DimLocation Dimension được chuẩn hóa mà không làm mất bất kỳ thông tin nào. Đây được gọi là lược đồ Bông tuyết trong đó các bảng thứ nguyên được chuẩn hóa thêm thành các bảng nhỏ hơn.
Lược đồ Thiên hà
Trong Lược đồ Thiên hà, có nhiều bảng Sự kiện và bảng Thứ nguyên. Mỗi bảng Dữ kiện lưu trữ các khóa chính của một vài bảng Thứ nguyên và các thước đo / dữ kiện để thực hiện phân tích.
Trong ví dụ trên, có hai bảng FactSales, FactShipping và nhiều bảng Dimension được kết hợp với bảng Fact. Mỗi bảng Dữ liệu có chứa Khóa chính cho các bảng Dim được kết hợp và các phép đo / Dữ kiện để thực hiện phân tích.