DBMS แบบกระจาย - สภาพแวดล้อมฐานข้อมูล

ในส่วนของบทช่วยสอนนี้เราจะศึกษาแง่มุมต่างๆที่ช่วยในการออกแบบสภาพแวดล้อมฐานข้อมูลแบบกระจาย บทนี้เริ่มต้นด้วยประเภทของฐานข้อมูลแบบกระจาย ฐานข้อมูลแบบกระจายสามารถแบ่งออกเป็นฐานข้อมูลที่เป็นเนื้อเดียวกันและแตกต่างกันโดยมีการแบ่งแยกเพิ่มเติม ส่วนถัดไปของบทนี้จะกล่าวถึงสถาปัตยกรรมแบบกระจาย ได้แก่ ไคลเอนต์ - เซิร์ฟเวอร์เพียร์ - ทูเพียร์และหลาย DBMS ในที่สุดก็มีการนำเสนอทางเลือกในการออกแบบที่แตกต่างกันเช่นการจำลองแบบและการแยกส่วน

ประเภทของฐานข้อมูลแบบกระจาย

ฐานข้อมูลแบบกระจายสามารถแบ่งออกได้อย่างกว้าง ๆ เป็นสภาพแวดล้อมฐานข้อมูลแบบกระจายที่เป็นเนื้อเดียวกันและต่างกันโดยแต่ละส่วนจะมีหน่วยงานย่อยเพิ่มเติมดังแสดงในภาพประกอบต่อไปนี้

ฐานข้อมูลที่กระจายเป็นเนื้อเดียวกัน

ในฐานข้อมูลแบบกระจายที่เป็นเนื้อเดียวกันไซต์ทั้งหมดใช้ DBMS และระบบปฏิบัติการที่เหมือนกัน คุณสมบัติของมันคือ -

  • ไซต์นี้ใช้ซอฟต์แวร์ที่คล้ายกันมาก

  • ไซต์ใช้ DBMS หรือ DBMS ที่เหมือนกันจากผู้ขายรายเดียวกัน

  • แต่ละไซต์ตระหนักถึงไซต์อื่น ๆ ทั้งหมดและร่วมมือกับไซต์อื่น ๆ เพื่อดำเนินการตามคำขอของผู้ใช้

  • ฐานข้อมูลถูกเข้าถึงผ่านอินเทอร์เฟซเดียวราวกับว่าเป็นฐานข้อมูลเดียว

ประเภทของฐานข้อมูลแบบกระจายที่เป็นเนื้อเดียวกัน

ฐานข้อมูลแบบกระจายที่เป็นเนื้อเดียวกันมีสองประเภท -

  • Autonomous- แต่ละฐานข้อมูลเป็นอิสระที่ทำหน้าที่ของตัวเอง พวกเขารวมเข้าด้วยกันโดยแอปพลิเคชันควบคุมและใช้การส่งผ่านข้อความเพื่อแบ่งปันการอัปเดตข้อมูล

  • Non-autonomous - ข้อมูลถูกกระจายไปตามโหนดที่เป็นเนื้อเดียวกันและ DBMS ส่วนกลางหรือหลักจะประสานการอัปเดตข้อมูลทั่วทั้งไซต์

ฐานข้อมูลแบบกระจายที่แตกต่างกัน

ในฐานข้อมูลแบบกระจายที่แตกต่างกันไซต์ต่างๆจะมีระบบปฏิบัติการผลิตภัณฑ์ DBMS และโมเดลข้อมูลที่แตกต่างกัน คุณสมบัติของมันคือ -

  • ไซต์ต่างๆใช้สกีมาและซอฟต์แวร์ที่แตกต่างกัน

  • ระบบอาจประกอบด้วย DBMS หลายแบบเช่นเชิงสัมพันธ์เครือข่ายลำดับชั้นหรือเชิงวัตถุ

  • การประมวลผลการสืบค้นมีความซับซ้อนเนื่องจากรูปแบบที่แตกต่างกัน

  • การประมวลผลธุรกรรมมีความซับซ้อนเนื่องจากซอฟต์แวร์ที่แตกต่างกัน

  • ไซต์อาจไม่ทราบถึงไซต์อื่น ๆ ดังนั้นจึงมีความร่วมมือที่ จำกัด ในการประมวลผลคำขอของผู้ใช้

ประเภทของฐานข้อมูลแบบกระจายที่แตกต่างกัน

  • Federated - ระบบฐานข้อมูลที่แตกต่างกันมีลักษณะเป็นอิสระและรวมเข้าด้วยกันเพื่อให้ทำงานเป็นระบบฐานข้อมูลเดียว

  • Un-federated - ระบบฐานข้อมูลใช้โมดูลการประสานงานกลางซึ่งเข้าถึงฐานข้อมูลได้

สถาปัตยกรรม DBMS แบบกระจาย

โดยทั่วไปสถาปัตยกรรม DDBMS ได้รับการพัฒนาขึ้นอยู่กับพารามิเตอร์สามตัว -

  • Distribution - ระบุการกระจายทางกายภาพของข้อมูลในไซต์ต่างๆ

  • Autonomy - บ่งบอกถึงการกระจายการควบคุมของระบบฐานข้อมูลและระดับที่ DBMS แต่ละองค์ประกอบสามารถทำงานได้อย่างอิสระ

  • Heterogeneity - หมายถึงความสม่ำเสมอหรือความแตกต่างกันของแบบจำลองข้อมูลส่วนประกอบของระบบและฐานข้อมูล

แบบจำลองสถาปัตยกรรม

แบบจำลองสถาปัตยกรรมทั่วไปบางส่วน ได้แก่ -

  • ไคลเอนต์ - สถาปัตยกรรมเซิร์ฟเวอร์สำหรับ DDBMS
  • Peer - to - Peer Architecture สำหรับ DDBMS
  • สถาปัตยกรรมหลาย DBMS

ไคลเอนต์ - สถาปัตยกรรมเซิร์ฟเวอร์สำหรับ DDBMS

นี่คือสถาปัตยกรรมสองระดับที่แบ่งการทำงานออกเป็นเซิร์ฟเวอร์และไคลเอนต์ เซิร์ฟเวอร์ทำหน้าที่หลักในการจัดการข้อมูลการประมวลผลการสืบค้นการเพิ่มประสิทธิภาพและการจัดการธุรกรรม ฟังก์ชันไคลเอนต์ประกอบด้วยส่วนติดต่อผู้ใช้เป็นหลัก อย่างไรก็ตามมีฟังก์ชันบางอย่างเช่นการตรวจสอบความสอดคล้องและการจัดการธุรกรรม

ไคลเอนต์ที่แตกต่างกันสองแบบ - สถาปัตยกรรมเซิร์ฟเวอร์คือ -

  • เซิร์ฟเวอร์เดียวหลายไคลเอนต์
  • ไคลเอนต์หลายเซิร์ฟเวอร์หลายตัว (แสดงในแผนภาพต่อไปนี้)

Peer-to-Peer Architecture สำหรับ DDBMS

ในระบบเหล่านี้แต่ละเพียร์ทำหน้าที่เป็นทั้งไคลเอนต์และเซิร์ฟเวอร์สำหรับการให้บริการฐานข้อมูล เพื่อนร่วมงานแบ่งปันทรัพยากรของตนกับเพื่อนคนอื่น ๆ และประสานกิจกรรมของพวกเขา

สถาปัตยกรรมนี้โดยทั่วไปมีแผนผังสี่ระดับ -

  • Global Conceptual Schema - แสดงถึงมุมมองข้อมูลเชิงตรรกะทั่วโลก

  • Local Conceptual Schema - แสดงถึงการจัดระเบียบข้อมูลเชิงตรรกะในแต่ละไซต์

  • Local Internal Schema - แสดงการจัดระเบียบข้อมูลทางกายภาพในแต่ละไซต์

  • External Schema - แสดงมุมมองของผู้ใช้ข้อมูล

สถาปัตยกรรมหลาย DBMS

นี่คือระบบฐานข้อมูลแบบบูรณาการที่เกิดจากการรวบรวมระบบฐานข้อมูลอิสระตั้งแต่สองระบบขึ้นไป

Multi-DBMS สามารถแสดงผ่านสคีมาหกระดับ -

  • Multi-database View Level - แสดงให้เห็นมุมมองของผู้ใช้หลายคนซึ่งประกอบด้วยส่วนย่อยของฐานข้อมูลแบบกระจายรวม

  • Multi-database Conceptual Level - แสดงถึงฐานข้อมูลหลายฐานข้อมูลแบบบูรณาการซึ่งประกอบด้วยข้อกำหนดโครงสร้างฐานข้อมูลหลายฐานข้อมูลเชิงตรรกะระดับโลก

  • Multi-database Internal Level - แสดงให้เห็นถึงการกระจายข้อมูลในไซต์ต่างๆและหลายฐานข้อมูลไปยังการทำแผนที่ข้อมูลในพื้นที่

  • Local database View Level - แสดงให้เห็นถึงมุมมองสาธารณะของข้อมูลท้องถิ่น

  • Local database Conceptual Level - แสดงองค์กรข้อมูลท้องถิ่นในแต่ละไซต์

  • Local database Internal Level - แสดงการจัดระเบียบข้อมูลทางกายภาพในแต่ละไซต์

มีสองทางเลือกในการออกแบบสำหรับ multi-DBMS -

  • แบบจำลองที่มีระดับแนวคิดหลายฐานข้อมูล
  • แบบจำลองที่ไม่มีระดับแนวคิดหลายฐานข้อมูล

ทางเลือกในการออกแบบ

ทางเลือกในการออกแบบการแจกจ่ายสำหรับตารางใน DDBMS มีดังนี้ -

  • ไม่จำลองแบบและไม่แยกส่วน
  • จำลองแบบเต็มที่
  • จำลองบางส่วน
  • Fragmented
  • Mixed

ไม่จำลองแบบและไม่แยกส่วน

ในทางเลือกการออกแบบนี้ตารางต่างๆจะถูกวางไว้ที่ไซต์ต่างๆ ข้อมูลถูกวางไว้เพื่อให้อยู่ใกล้กับไซต์ที่มีการใช้งานมากที่สุด เหมาะที่สุดสำหรับระบบฐานข้อมูลที่เปอร์เซ็นต์ของแบบสอบถามที่จำเป็นในการรวมข้อมูลในตารางที่วางไว้ที่ไซต์ต่างๆอยู่ในระดับต่ำ หากมีการใช้กลยุทธ์การกระจายที่เหมาะสมทางเลือกในการออกแบบนี้จะช่วยลดต้นทุนการสื่อสารระหว่างการประมวลผลข้อมูล

จำลองแบบเต็มที่

ในทางเลือกการออกแบบนี้ในแต่ละไซต์จะมีการจัดเก็บสำเนาตารางฐานข้อมูลทั้งหมดหนึ่งชุด เนื่องจากแต่ละไซต์มีสำเนาของฐานข้อมูลทั้งหมดการสืบค้นจึงรวดเร็วมากโดยต้องเสียค่าใช้จ่ายในการสื่อสารเล็กน้อย ในทางตรงกันข้ามข้อมูลซ้ำซ้อนจำนวนมากต้องใช้ค่าใช้จ่ายจำนวนมากในระหว่างการดำเนินการอัปเดต ดังนั้นจึงเหมาะสำหรับระบบที่จำเป็นต้องจัดการแบบสอบถามจำนวนมากในขณะที่จำนวนการอัปเดตฐานข้อมูลมีน้อย

จำลองบางส่วน

สำเนาของตารางหรือบางส่วนของตารางจะถูกเก็บไว้ที่ไซต์ต่างๆ การกระจายตารางจะกระทำตามความถี่ในการเข้าถึง สิ่งนี้คำนึงถึงความจริงที่ว่าความถี่ในการเข้าถึงตารางนั้นแตกต่างกันไปมากในแต่ละไซต์ จำนวนสำเนาของตาราง (หรือบางส่วน) ขึ้นอยู่กับความถี่ในการดำเนินการสืบค้นการเข้าถึงและไซต์ที่สร้างคิวรีการเข้าถึง

แยกส่วน

ในการออกแบบนี้ตารางจะถูกแบ่งออกเป็นสองส่วนขึ้นไปเรียกว่าชิ้นส่วนหรือพาร์ติชันและแต่ละส่วนสามารถจัดเก็บไว้ที่ไซต์ต่างๆได้ สิ่งนี้พิจารณาถึงความจริงที่ว่าแทบจะไม่เกิดขึ้นเลยที่ข้อมูลทั้งหมดที่จัดเก็บในตารางจำเป็นต้องใช้ในไซต์ที่กำหนด ยิ่งไปกว่านั้นการแยกส่วนยังเพิ่มความเท่าเทียมกันและให้การกู้คืนจากภัยพิบัติที่ดีขึ้น ที่นี่มีเพียงสำเนาเดียวของแต่ละส่วนในระบบนั่นคือไม่มีข้อมูลซ้ำซ้อน

เทคนิคการแยกส่วนทั้งสามคือ -

  • การกระจายตัวในแนวตั้ง
  • การกระจายตัวในแนวนอน
  • การกระจายตัวแบบไฮบริด

การกระจายแบบผสม

นี่คือการรวมกันของการแยกส่วนและการจำลองแบบบางส่วน ที่นี่ตารางจะถูกแยกส่วนในรูปแบบใด ๆ (แนวนอนหรือแนวตั้ง) จากนั้นส่วนเหล่านี้จะถูกจำลองแบบบางส่วนในไซต์ต่างๆตามความถี่ในการเข้าถึงส่วนต่างๆ