DBMS phân tán - Cơ sở dữ liệu phân tán
Chương này giới thiệu khái niệm DDBMS. Trong cơ sở dữ liệu phân tán, có một số cơ sở dữ liệu có thể được phân phối theo địa lý trên toàn thế giới. DBMS phân tán quản lý cơ sở dữ liệu phân tán theo cách để nó xuất hiện dưới dạng một cơ sở dữ liệu duy nhất cho người dùng. Trong phần sau của chương, chúng ta tiếp tục nghiên cứu các yếu tố dẫn đến cơ sở dữ liệu phân tán, ưu nhược điểm của nó.
A distributed database là một tập hợp của nhiều cơ sở dữ liệu được kết nối với nhau, được trải rộng về mặt vật lý trên các địa điểm khác nhau giao tiếp qua mạng máy tính.
Đặc trưng
Các cơ sở dữ liệu trong bộ sưu tập có mối quan hệ logic với nhau. Thường thì chúng đại diện cho một cơ sở dữ liệu logic duy nhất.
Dữ liệu được lưu trữ vật lý trên nhiều trang web. Dữ liệu trong mỗi trang web có thể được quản lý bởi một DBMS độc lập với các trang web khác.
Các bộ xử lý trong các trang web được kết nối thông qua một mạng. Chúng không có bất kỳ cấu hình đa xử lý nào.
Cơ sở dữ liệu phân tán không phải là một hệ thống tệp được kết nối lỏng lẻo.
Cơ sở dữ liệu phân tán kết hợp xử lý giao dịch, nhưng nó không đồng nghĩa với một hệ thống xử lý giao dịch.
Hệ thống quản lý cơ sở dữ liệu phân tán
Hệ quản trị cơ sở dữ liệu phân tán (DDBMS) là một hệ thống phần mềm tập trung quản lý cơ sở dữ liệu phân tán theo cách như thể tất cả được lưu trữ tại một vị trí duy nhất.
Đặc trưng
Nó được sử dụng để tạo, truy xuất, cập nhật và xóa cơ sở dữ liệu phân tán.
Nó đồng bộ hóa cơ sở dữ liệu theo định kỳ và cung cấp các cơ chế truy cập nhờ đó việc phân phối trở nên minh bạch với người dùng.
Nó đảm bảo rằng dữ liệu được sửa đổi tại bất kỳ trang web nào được cập nhật trên toàn cầu.
Nó được sử dụng trong các lĩnh vực ứng dụng nơi lượng lớn dữ liệu được xử lý và truy cập đồng thời bởi nhiều người dùng.
Nó được thiết kế cho các nền tảng cơ sở dữ liệu không đồng nhất.
Nó duy trì tính bảo mật và tính toàn vẹn dữ liệu của cơ sở dữ liệu.
Các yếu tố khuyến khích DDBMS
Các yếu tố sau khuyến khích chuyển sang DDBMS:
Distributed Nature of Organizational Units- Hầu hết các tổ chức trong thời điểm hiện tại được chia nhỏ thành nhiều đơn vị phân bổ trên toàn cầu. Mỗi đơn vị yêu cầu bộ dữ liệu cục bộ của riêng mình. Do đó, cơ sở dữ liệu tổng thể của tổ chức trở nên phân tán.
Need for Sharing of Data- Nhiều đơn vị tổ chức thường cần giao tiếp với nhau và chia sẻ dữ liệu và tài nguyên của họ. Điều này đòi hỏi cơ sở dữ liệu chung hoặc cơ sở dữ liệu nhân bản phải được sử dụng một cách đồng bộ.
Support for Both OLTP and OLAP- Xử lý Giao dịch Trực tuyến (OLTP) và Xử lý Phân tích Trực tuyến (OLAP) hoạt động dựa trên các hệ thống đa dạng có thể có dữ liệu chung. Hệ thống cơ sở dữ liệu phân tán hỗ trợ cả việc xử lý này bằng cách cung cấp dữ liệu đồng bộ.
Database Recovery- Một trong những kỹ thuật phổ biến được sử dụng trong DDBMS là sao chép dữ liệu trên các trang web khác nhau. Sao chép dữ liệu tự động giúp khôi phục dữ liệu nếu cơ sở dữ liệu trong bất kỳ trang web nào bị hỏng. Người dùng có thể truy cập dữ liệu từ các trang web khác trong khi trang web bị hư hỏng đang được xây dựng lại. Do đó, lỗi cơ sở dữ liệu có thể trở nên gần như không dễ thấy đối với người dùng.
Support for Multiple Application Software- Hầu hết các tổ chức sử dụng nhiều phần mềm ứng dụng khác nhau với sự hỗ trợ cơ sở dữ liệu cụ thể của nó. DDBMS cung cấp một chức năng thống nhất để sử dụng cùng một dữ liệu giữa các nền tảng khác nhau.
Ưu điểm của Cơ sở dữ liệu Phân tán
Sau đây là những ưu điểm của cơ sở dữ liệu phân tán so với cơ sở dữ liệu tập trung.
Modular Development- Nếu hệ thống cần được mở rộng đến các địa điểm mới hoặc đơn vị mới, trong các hệ thống cơ sở dữ liệu tập trung, hành động đòi hỏi nỗ lực đáng kể và sự gián đoạn trong hoạt động hiện có. Tuy nhiên, trong cơ sở dữ liệu phân tán, công việc chỉ yêu cầu thêm máy tính mới và dữ liệu cục bộ vào trang web mới và cuối cùng là kết nối chúng với hệ thống phân tán, không bị gián đoạn các chức năng hiện tại.
More Reliable- Trường hợp cơ sở dữ liệu bị lỗi, hệ thống cơ sở dữ liệu tổng thể tập trung tạm dừng. Tuy nhiên, trong các hệ thống phân tán, khi một thành phần bị lỗi, hoạt động của hệ thống vẫn tiếp tục có thể bị giảm hiệu suất. Do đó DDBMS đáng tin cậy hơn.
Better Response- Nếu dữ liệu được phân phối một cách hiệu quả, thì các yêu cầu của người dùng có thể được đáp ứng từ chính dữ liệu cục bộ, do đó cung cấp phản hồi nhanh hơn. Mặt khác, trong các hệ thống tập trung, tất cả các truy vấn phải thông qua máy tính trung tâm để xử lý, điều này làm tăng thời gian phản hồi.
Lower Communication Cost- Trong các hệ thống cơ sở dữ liệu phân tán, nếu dữ liệu được đặt tại địa phương nơi nó được sử dụng chủ yếu, thì chi phí truyền thông để thao tác dữ liệu có thể được giảm thiểu. Điều này không khả thi trong các hệ thống tập trung.
Những bất lợi của Cơ sở dữ liệu Phân tán
Sau đây là một số khó khăn liên quan đến cơ sở dữ liệu phân tán.
Need for complex and expensive software - DDBMS đòi hỏi phần mềm phức tạp và thường đắt tiền để cung cấp tính minh bạch và phối hợp dữ liệu trên một số địa điểm.
Processing overhead - Ngay cả các hoạt động đơn giản cũng có thể yêu cầu một số lượng lớn thông tin liên lạc và các tính toán bổ sung để cung cấp tính đồng nhất về dữ liệu trên các trang web.
Data integrity - Nhu cầu cập nhật dữ liệu ở nhiều trang web đặt ra các vấn đề về tính toàn vẹn của dữ liệu.
Overheads for improper data distribution- Khả năng đáp ứng của các truy vấn phụ thuộc phần lớn vào việc phân phối dữ liệu thích hợp. Việc phân phối dữ liệu không đúng cách thường dẫn đến phản hồi rất chậm đối với các yêu cầu của người dùng.