Kho dữ liệu - Quy trình phân phối
Một kho dữ liệu không bao giờ tĩnh; nó phát triển khi doanh nghiệp mở rộng. Khi doanh nghiệp phát triển, các yêu cầu của nó liên tục thay đổi và do đó kho dữ liệu phải được thiết kế để đáp ứng những thay đổi này. Do đó, một hệ thống kho dữ liệu cần phải linh hoạt.
Tốt nhất là nên có một quy trình phân phối để cung cấp một kho dữ liệu. Tuy nhiên, các dự án kho dữ liệu thường gặp phải nhiều vấn đề khác nhau gây khó khăn cho việc hoàn thành nhiệm vụ và phân phối theo yêu cầu nghiêm ngặt và có thứ tự của phương pháp thác nước. Hầu hết các lần, các yêu cầu không được hiểu hoàn toàn. Các kiến trúc, thiết kế và các thành phần xây dựng chỉ có thể được hoàn thành sau khi thu thập và nghiên cứu tất cả các yêu cầu.
phương thức vận chuyển
Phương pháp phân phối là một biến thể của phương pháp tiếp cận phát triển ứng dụng chung được áp dụng để phân phối kho dữ liệu. Chúng tôi đã dàn dựng quy trình phân phối kho dữ liệu để giảm thiểu rủi ro. Cách tiếp cận mà chúng ta sẽ thảo luận ở đây không làm giảm quy mô thời gian giao hàng tổng thể nhưng đảm bảo lợi ích kinh doanh được phân phối tăng dần trong quá trình phát triển.
Note - Quá trình giao hàng được chia thành các giai đoạn để giảm rủi ro dự án và giao hàng.
Sơ đồ sau giải thích các giai đoạn trong quy trình giao hàng -
Chiến lược CNTT
Kho dữ liệu là những khoản đầu tư chiến lược đòi hỏi một quá trình kinh doanh để tạo ra lợi ích. Chiến lược CNTT là cần thiết để mua sắm và giữ lại vốn cho dự án.
Trường hợp kinh doanh
Mục tiêu của trường hợp kinh doanh là ước tính lợi ích kinh doanh có được từ việc sử dụng kho dữ liệu. Những lợi ích này có thể không định lượng được nhưng những lợi ích dự kiến cần phải được trình bày rõ ràng. Nếu một kho dữ liệu không có một trường hợp kinh doanh rõ ràng, thì doanh nghiệp có xu hướng gặp phải các vấn đề về uy tín ở một số giai đoạn trong quá trình giao hàng. Do đó trong các dự án kho dữ liệu, chúng ta cần hiểu trường hợp kinh doanh để đầu tư.
Giáo dục và tạo mẫu
Các tổ chức thử nghiệm khái niệm phân tích dữ liệu và tự giáo dục về giá trị của việc có kho dữ liệu trước khi tìm ra giải pháp. Điều này được giải quyết bằng cách tạo mẫu. Nó giúp hiểu được tính khả thi và lợi ích của kho dữ liệu. Hoạt động tạo mẫu ở quy mô nhỏ có thể thúc đẩy quá trình giáo dục miễn là -
Nguyên mẫu đề cập đến một mục tiêu kỹ thuật xác định.
Nguyên mẫu có thể bị vứt bỏ sau khi khái niệm khả thi đã được hiển thị.
Hoạt động giải quyết một tập hợp nhỏ nội dung dữ liệu cuối cùng của kho dữ liệu.
Khoảng thời gian hoạt động không quan trọng.
Những điểm sau đây cần được ghi nhớ để tạo ra bản phát hành sớm và mang lại lợi ích kinh doanh.
Xác định kiến trúc có khả năng phát triển.
Tập trung vào các yêu cầu kinh doanh và các giai đoạn thiết kế kỹ thuật.
Giới hạn phạm vi của giai đoạn xây dựng đầu tiên ở mức tối thiểu để mang lại lợi ích kinh doanh.
Hiểu các yêu cầu ngắn hạn và trung hạn của kho dữ liệu.
Yêu cầu kinh doanh
Để cung cấp các sản phẩm có chất lượng, chúng tôi nên đảm bảo các yêu cầu tổng thể được hiểu rõ. Nếu chúng tôi hiểu các yêu cầu kinh doanh cho cả ngắn hạn và trung hạn, thì chúng tôi có thể thiết kế một giải pháp để đáp ứng các yêu cầu ngắn hạn. Sau đó, giải pháp ngắn hạn có thể được phát triển thành giải pháp đầy đủ.
Các khía cạnh sau đây được xác định trong giai đoạn này:
Quy tắc kinh doanh được áp dụng trên dữ liệu.
Mô hình logic cho thông tin trong kho dữ liệu.
Các cấu hình truy vấn cho yêu cầu ngay lập tức.
Hệ thống nguồn cung cấp dữ liệu này.
Bản thiết kế kỹ thuật
Giai đoạn này cần phải cung cấp một kiến trúc tổng thể đáp ứng các yêu cầu dài hạn. Giai đoạn này cũng cung cấp các thành phần phải được thực hiện trong thời gian ngắn hạn để thu được bất kỳ lợi ích kinh doanh nào. Bản thiết kế cần xác định những điều sau đây.
- Kiến trúc hệ thống tổng thể.
- Chính sách lưu giữ dữ liệu.
- Chiến lược sao lưu và phục hồi.
- Kiến trúc máy chủ và kho dữ liệu.
- Kế hoạch năng lực cho phần cứng và cơ sở hạ tầng.
- Các thành phần của thiết kế cơ sở dữ liệu.
Xây dựng phiên bản
Trong giai đoạn này, sản phẩm đầu tiên có thể phân phối được sản xuất. Sản phẩm có thể phân phối này là thành phần nhỏ nhất của kho dữ liệu. Thành phần nhỏ nhất này làm tăng thêm lợi ích kinh doanh.
Tải lịch sử
Đây là giai đoạn mà phần còn lại của lịch sử cần thiết được tải vào kho dữ liệu. Trong giai đoạn này, chúng tôi không thêm các thực thể mới, nhưng các bảng vật lý bổ sung có thể sẽ được tạo để lưu trữ khối lượng dữ liệu tăng lên.
Chúng ta hãy lấy một ví dụ. Giả sử giai đoạn phiên bản xây dựng đã cung cấp kho dữ liệu phân tích doanh số bán lẻ với lịch sử trị giá 2 tháng. Thông tin này sẽ cho phép người dùng chỉ phân tích các xu hướng gần đây và giải quyết các vấn đề ngắn hạn. Người dùng trong trường hợp này không thể xác định xu hướng hàng năm và theo mùa. Để giúp anh ấy làm như vậy, lịch sử bán hàng trong 2 năm qua có thể được tải từ kho lưu trữ. Giờ đây, dữ liệu 40GB được mở rộng thành 400GB.
Note - Các quy trình sao lưu và phục hồi có thể trở nên phức tạp, do đó chúng tôi khuyến nghị thực hiện hoạt động này trong một giai đoạn riêng biệt.
Truy vấn đặc biệt
Trong giai đoạn này, chúng tôi định cấu hình một công cụ truy vấn đặc biệt được sử dụng để vận hành một kho dữ liệu. Các công cụ này có thể tạo truy vấn cơ sở dữ liệu.
Note - Khuyến cáo không sử dụng các công cụ truy cập này khi cơ sở dữ liệu đang được sửa đổi cơ bản.
Tự động hóa
Trong giai đoạn này, các quy trình quản lý vận hành hoàn toàn tự động. Chúng sẽ bao gồm -
Chuyển dữ liệu thành một dạng phù hợp để phân tích.
Giám sát hồ sơ truy vấn và xác định các tổng hợp thích hợp để duy trì hiệu suất hệ thống.
Trích xuất và tải dữ liệu từ các hệ thống nguồn khác nhau.
Tạo tổng hợp từ các định nghĩa được xác định trước trong kho dữ liệu.
Sao lưu, khôi phục và lưu trữ dữ liệu.
Mở rộng phạm vi
Trong giai đoạn này, kho dữ liệu được mở rộng để giải quyết một loạt các yêu cầu kinh doanh mới. Phạm vi có thể được mở rộng theo hai cách:
Bằng cách tải dữ liệu bổ sung vào kho dữ liệu.
Bằng cách giới thiệu các kho dữ liệu mới bằng cách sử dụng thông tin hiện có.
Note - Giai đoạn này nên được thực hiện riêng biệt, vì nó liên quan đến những nỗ lực và độ phức tạp đáng kể.
Yêu cầu Tiến hóa
Từ quan điểm của quá trình giao hàng, các yêu cầu luôn thay đổi. Chúng không tĩnh. Quá trình phân phối phải hỗ trợ điều này và cho phép những thay đổi này được phản ánh trong hệ thống.
Vấn đề này được giải quyết bằng cách thiết kế kho dữ liệu xoay quanh việc sử dụng dữ liệu trong các quy trình kinh doanh, trái ngược với các yêu cầu dữ liệu của các truy vấn hiện có.
Kiến trúc được thiết kế để thay đổi và phát triển để phù hợp với nhu cầu kinh doanh, quy trình hoạt động như một quy trình phát triển ứng dụng giả, nơi các yêu cầu mới liên tục được đưa vào các hoạt động phát triển và các sản phẩm phân phối từng phần được sản xuất. Các sản phẩm phân phối từng phần này được cung cấp lại cho người dùng và sau đó được làm lại để đảm bảo rằng hệ thống tổng thể được cập nhật liên tục để đáp ứng nhu cầu kinh doanh.