DW - Tổng quan
Kho dữ liệu được biết đến như một kho lưu trữ trung tâm để lưu trữ dữ liệu từ một hoặc nhiều nguồn dữ liệu không đồng nhất. Kho dữ liệu được sử dụng để báo cáo và phân tích thông tin và lưu trữ cả dữ liệu lịch sử và hiện tại. Dữ liệu trong hệ thống DW được sử dụng cho báo cáo Phân tích, sau này được các Nhà phân tích kinh doanh, Giám đốc bán hàng hoặc Nhân viên tri thức sử dụng để ra quyết định.
Dữ liệu trong hệ thống DW được tải từ một hệ thống giao dịch hoạt động như Bán hàng, Tiếp thị, Nhân sự, SCM, v.v. Nó có thể chuyển qua kho dữ liệu hoạt động hoặc các chuyển đổi khác trước khi được tải vào hệ thống DW để xử lý thông tin.
Kho dữ liệu - Tính năng chính
Các tính năng chính của Hệ thống DW là:
Nó là kho dữ liệu trung tâm, nơi dữ liệu được lưu trữ từ một hoặc nhiều nguồn dữ liệu không đồng nhất.
Hệ thống DW lưu trữ cả dữ liệu hiện tại và dữ liệu lịch sử. Thông thường một hệ thống DW lưu trữ dữ liệu lịch sử từ 5-10 năm.
Một hệ thống DW luôn được giữ riêng biệt với một hệ thống giao dịch hoạt động.
Dữ liệu trong hệ thống DW được sử dụng cho các loại báo cáo phân tích khác nhau, từ so sánh hàng quý đến hàng năm.
Cần một hệ thống DW
Giả sử bạn có một đại lý cho vay mua nhà nơi dữ liệu đến từ nhiều ứng dụng như tiếp thị, bán hàng, ERP, HRM, MM, v.v. Dữ liệu này được trích xuất, chuyển đổi và tải trong Data Warehouse.
Ví dụ: nếu bạn phải so sánh doanh số hàng quý / hàng năm của một sản phẩm, bạn không thể sử dụng cơ sở dữ liệu giao dịch Hoạt động, vì điều này sẽ làm treo hệ thống giao dịch. Do đó, một Kho dữ liệu được sử dụng cho mục đích này.
Sự khác biệt giữa DW và ODB
Sự khác biệt giữa Kho dữ liệu và Cơ sở dữ liệu hoạt động (Cơ sở dữ liệu giao dịch) như sau:
Hệ thống Giao dịch được thiết kế cho các khối lượng công việc và giao dịch đã biết như cập nhật bản ghi người dùng, tìm kiếm bản ghi, v.v. Tuy nhiên, các giao dịch Kho dữ liệu phức tạp hơn và hiển thị dạng dữ liệu chung.
Hệ thống Giao dịch chứa dữ liệu hiện tại của một tổ chức và Kho dữ liệu thường chứa dữ liệu lịch sử.
Hệ thống giao dịch hỗ trợ xử lý song song nhiều giao dịch. Cần có cơ chế kiểm soát và khôi phục đồng thời để duy trì tính nhất quán của cơ sở dữ liệu.
Truy vấn cơ sở dữ liệu Hoạt động cho phép đọc và sửa đổi các hoạt động (xóa và Cập nhật) trong khi truy vấn OLAP chỉ cần quyền truy cập chỉ đọc đối với dữ liệu được lưu trữ (Câu lệnh Chọn).
Kiến trúc DW
Kho dữ liệu liên quan đến việc làm sạch dữ liệu, tích hợp dữ liệu và hợp nhất dữ liệu.
Kho dữ liệu có kiến trúc 3 lớp - Data Source Layer, Integration Layer, và Presentation Layer. Hình minh họa ở trên cho thấy kiến trúc chung của một hệ thống Kho dữ liệu.