SAP HANA - สคีมาในคลังข้อมูล

Schemas คือคำอธิบายเชิงตรรกะของตารางในคลังข้อมูล Schemas ถูกสร้างขึ้นโดยการรวมตาราง fact และ Dimension หลาย ๆ ตัวเข้าด้วยกันเพื่อให้เป็นไปตามตรรกะทางธุรกิจบางอย่าง

ฐานข้อมูลใช้แบบจำลองเชิงสัมพันธ์ในการจัดเก็บข้อมูล อย่างไรก็ตามคลังข้อมูลใช้ Schemas ที่รวมมิติและตารางข้อเท็จจริงเพื่อให้เป็นไปตามตรรกะทางธุรกิจ Schemas ที่ใช้ในคลังข้อมูลมีสามประเภท -

  • สคีมาของดาว
  • สคีมาเกล็ดหิมะ
  • Galaxy Schema

สคีมาของดาว

ใน Star Schema แต่ละมิติจะรวมเข้ากับตาราง Fact เดียว แต่ละมิติจะแสดงด้วยมิติเดียวเท่านั้นและไม่ถูกทำให้เป็นมาตรฐานต่อไป

ตารางมิติประกอบด้วยชุดแอตทริบิวต์ที่ใช้ในการวิเคราะห์ข้อมูล

Example - ในตัวอย่างด้านล่างนี้เรามีตาราง Fact FactSales ที่มีคีย์หลักสำหรับตาราง Dim ทั้งหมดและวัด units_sold และ dollar_ ที่ขายเพื่อทำการวิเคราะห์

เรามีตารางมิติข้อมูลสี่ตาราง ได้แก่ DimTime, DimItem, DimBranch, DimLocation

ตารางมิติข้อมูลแต่ละตารางเชื่อมต่อกับตารางข้อเท็จจริงเนื่องจากตารางข้อเท็จจริงมีคีย์หลักสำหรับแต่ละตารางมิติที่ใช้เพื่อรวมตารางสองตาราง

ข้อเท็จจริง / มาตรการในตารางข้อเท็จจริงใช้เพื่อวัตถุประสงค์ในการวิเคราะห์พร้อมกับแอตทริบิวต์ในตารางมิติข้อมูล

สคีมาเกล็ดหิมะ

ในสคีมาของ Snowflakes ตารางมิติข้อมูลบางส่วนจะเป็นตารางเพิ่มเติมปกติและตาราง Dim เชื่อมต่อกับตารางข้อมูลเดี่ยว Normalization ใช้เพื่อจัดระเบียบแอตทริบิวต์และตารางของฐานข้อมูลเพื่อลดความซ้ำซ้อนของข้อมูล

Normalization เกี่ยวข้องกับการทำลายตารางให้เป็นตารางขนาดเล็กที่ซ้ำซ้อนน้อยลงโดยไม่สูญเสียข้อมูลใด ๆ และตารางขนาดเล็กจะถูกรวมเข้ากับตารางมิติข้อมูล

ในตัวอย่างข้างต้นตาราง DimItem และ DimLocation Dimension จะถูกทำให้เป็นมาตรฐานโดยไม่สูญเสียข้อมูลใด ๆ สิ่งนี้เรียกว่า Snowflakes schema ซึ่งตารางมิติจะถูกทำให้เป็นมาตรฐานต่อไปเป็นตารางขนาดเล็ก

Galaxy Schema

ใน Galaxy Schema มีตาราง Fact และตาราง Dimension หลายแบบ ตารางข้อมูลแต่ละตารางจะเก็บคีย์หลักของตารางมิติข้อมูลและมาตรการ / ข้อเท็จจริงเพื่อทำการวิเคราะห์

ในตัวอย่างข้างต้นมีตาราง Fact สองตาราง FactSales, FactShipping และตาราง Dimension หลายตารางที่เชื่อมต่อกับตาราง Fact ตารางข้อเท็จจริงแต่ละตารางประกอบด้วยคีย์หลักสำหรับตาราง Dim ที่เข้าร่วมและมาตรการ / ข้อเท็จจริงเพื่อทำการวิเคราะห์