Kho dữ liệu - Lược đồ
Một lược đồ được định nghĩa là một mô tả hợp lý của cơ sở dữ liệu nơi các bảng dữ kiện và thứ nguyên được kết hợp theo cách hợp lý. Kho dữ liệu được duy trì dưới dạng giản đồ Ngôi sao, Bông tuyết và Chòm sao dữ liệu.
Lược đồ sao
Lược đồ Star chứa một bảng dữ kiện và nhiều bảng thứ nguyên. Mỗi thứ nguyên chỉ được biểu thị bằng bảng một thứ nguyên và chúng không được chuẩn hóa. Bảng Thứ nguyên chứa một tập hợp các thuộc tính.
Nét đặc trưng
- Trong lược đồ Hình sao, chỉ có một bảng dữ kiện và nhiều bảng thứ nguyên.
- Trong giản đồ Hình sao, mỗi chiều được biểu thị bằng bảng một chiều.
- Bảng thứ nguyên không được chuẩn hóa trong lược đồ Hình sao.
- Mỗi bảng Thứ nguyên được nối với một khóa trong bảng dữ kiện.
Hình minh họa sau đây cho thấy dữ liệu bán hàng của một công ty liên quan đến bốn thứ nguyên, đó là Thời gian, Mặt hàng, Chi nhánh và Địa điểm.
Có một bảng thực tế ở trung tâm. Nó chứa các phím của mỗi chiều trong số bốn chiều. Bảng dữ kiện cũng chứa các thuộc tính, cụ thể là đô la đã bán và đơn vị đã bán.
Note- Mỗi thứ nguyên chỉ có một bảng thứ nguyên và mỗi bảng chứa một tập hợp các thuộc tính. Ví dụ: bảng thứ nguyên vị trí chứa tập thuộc tính {location_key, street, city, province_or_state, country}. Ràng buộc này có thể gây dư thừa dữ liệu.
For example- "Vancouver" và "Victoria" cả hai thành phố đều thuộc tỉnh British Columbia của Canada. Các mục nhập cho các thành phố như vậy có thể gây dư thừa dữ liệu dọc theo các thuộc tính tỉnh_hoặc và quốc gia.
Lược đồ bông tuyết
Một số bảng thứ nguyên trong lược đồ Snowflake được chuẩn hóa. Quá trình chuẩn hóa chia dữ liệu thành các bảng bổ sung như trong hình minh họa sau.
Không giống như trong lược đồ Ngôi sao, bảng thứ nguyên trong lược đồ bông tuyết được chuẩn hóa.
For example- Bảng kích thước mặt hàng trong giản đồ hình sao được chuẩn hóa và chia thành hai bảng thứ nguyên, đó là mặt hàng và bảng nhà cung cấp. Bây giờ, bảng thứ nguyên mặt hàng chứa các thuộc tính item_key, item_name, type, brand và nhà cung cấp-key.
Khóa nhà cung cấp được liên kết với bảng kích thước nhà cung cấp. Bảng thứ nguyên nhà cung cấp có chứa các thuộc tính nhà cung cấp_có_mã_có_nhà cung cấp và loại_nhà cung cấp.
Note - Do quá trình chuẩn hóa trong lược đồ Snowflake, độ dư thừa được giảm bớt và do đó, nó trở nên dễ bảo trì và tiết kiệm không gian lưu trữ.
Lược đồ Chòm sao Sự thật (Lược đồ Thiên hà)
Một chòm sao dữ kiện có nhiều bảng dữ kiện. Nó còn được gọi là Lược đồ Thiên hà.
Hình minh họa sau đây cho thấy hai bảng dữ kiện, đó là Bán hàng và Vận chuyển -
Bảng thông tin doanh số cũng giống như bảng trong Lược đồ sao. Bảng thông tin vận chuyển có năm thứ nguyên, đó là item_key, time_key, shipper_key, from_location, to_location. Bảng dữ kiện vận chuyển cũng có hai thước đo, đó là đô la bán ra và đơn vị bán ra. Cũng có thể chia sẻ bảng thứ nguyên giữa các bảng dữ kiện.
For example - Bảng thứ nguyên thời gian, mặt hàng và vị trí được chia sẻ giữa bảng thông tin bán hàng và vận chuyển.