DW - Các loại
Có bốn loại hệ thống Kho dữ liệu.
- Dữ liệu Mart
- Xử lý phân tích trực tuyến (OLAP)
- Xử lý giao dịch trực tuyến (OLTP)
- Phân tích dự đoán (PA)
Dữ liệu Mart
Data Mart được biết đến là hình thức đơn giản nhất của hệ thống Data Warehouse và thường bao gồm một khu vực chức năng duy nhất trong một tổ chức như bán hàng, tài chính hoặc tiếp thị, v.v.
Data Mart trong một tổ chức và được tạo ra và quản lý bởi một bộ phận duy nhất. Vì nó thuộc về một bộ phận duy nhất, bộ phận này thường chỉ lấy dữ liệu từ một vài hoặc một loại nguồn / ứng dụng. Nguồn này có thể là một hệ thống hoạt động nội bộ, một kho dữ liệu hoặc một hệ thống bên ngoài.
Xử lý phân tích trực tuyến
Trong hệ thống OLAP, số lượng giao dịch ít hơn so với hệ thống giao dịch. Các truy vấn được thực hiện có bản chất phức tạp và liên quan đến việc tổng hợp dữ liệu.
Một tập hợp là gì?
Chúng tôi lưu các bảng với dữ liệu tổng hợp như hàng năm (1 hàng), hàng quý (4 hàng), hàng tháng (12 hàng) hoặc lâu hơn, nếu ai đó phải thực hiện so sánh hàng năm thì chỉ một hàng sẽ được xử lý. Tuy nhiên, trong một bảng chưa tổng hợp, nó sẽ so sánh tất cả các hàng.
SELECT SUM(salary)
FROM employee
WHERE title = 'Programmer';
Các biện pháp hiệu quả trong hệ thống OLAP
Thời gian phản hồi được coi là một trong những thước đo hiệu quả nhất và quan trọng nhất trong OLAPhệ thống. Dữ liệu lưu trữ tổng hợp được duy trì trong các lược đồ đa chiều như lược đồ hình sao (Khi dữ liệu được sắp xếp thành các nhóm phân cấp, thường được gọi là thứ nguyên và thành các dữ kiện và dữ kiện tổng hợp, nó được gọi là Lược đồ).
Độ trễ của hệ thống OLAP là vài giờ so với các siêu thị dữ liệu trong đó độ trễ dự kiến gần hơn một ngày.
Xử lý giao dịch trực tuyến
Trong hệ thống OLTP, có một số lượng lớn các giao dịch trực tuyến ngắn như CHÈN, CẬP NHẬT và XÓA.
Trong hệ thống OLTP, một thước đo hiệu quả là thời gian xử lý các giao dịch ngắn và rất ít. Nó kiểm soát tính toàn vẹn của dữ liệu trong môi trường đa truy cập. Đối với hệ thống OLTP, số lượng giao dịch mỗi giây đo lườngeffectiveness. Hệ thống kho dữ liệu OLTP chứa dữ liệu hiện tại và chi tiết và được duy trì trong các lược đồ trong mô hình thực thể (3NF).
Thí dụ
Hệ thống giao dịch hàng ngày trong một cửa hàng bán lẻ, nơi hồ sơ khách hàng được chèn, cập nhật và xóa hàng ngày. Nó cung cấp xử lý truy vấn rất nhanh. Cơ sở dữ liệu OLTP chứa dữ liệu chi tiết và hiện tại. Lược đồ được sử dụng để lưu trữ cơ sở dữ liệu OLTP là mô hình Thực thể.
Sự khác biệt giữa OLTP và OLAP
Các minh họa sau đây cho thấy sự khác biệt chính giữa OLTP và OLAP hệ thống.
Indexes - Hệ thống OLTP chỉ có ít chỉ mục trong khi trong hệ thống OLAP có rất nhiều chỉ mục để tối ưu hóa hiệu suất.
Joins- Trong hệ thống OLTP, số lượng lớn các phép nối và dữ liệu được chuẩn hóa. Tuy nhiên, trong một hệ thống OLAP có ít kết nối hơn và được khử chuẩn hóa.
Aggregation - Trong hệ thống OLTP, dữ liệu không được tổng hợp trong khi trong cơ sở dữ liệu OLAP, nhiều tập hợp hơn được sử dụng.
Phân tích tiên đoán
Phân tích dự đoán được biết đến như việc tìm ra các mẫu ẩn trong dữ liệu được lưu trữ trong hệ thống DW bằng cách sử dụng các hàm toán học khác nhau để dự đoán kết quả trong tương lai.
Hệ thống Phân tích Dự đoán khác với hệ thống OLAP về cách sử dụng. Nó được sử dụng để tập trung vào các kết quả trong tương lai. Hệ thống OALP tập trung vào xử lý dữ liệu hiện tại và lịch sử để báo cáo phân tích.