คลังข้อมูล - OLAP
Online Analytical Processing Server (OLAP) ขึ้นอยู่กับแบบจำลองข้อมูลหลายมิติ ช่วยให้ผู้จัดการและนักวิเคราะห์ได้รับข้อมูลเชิงลึกผ่านการเข้าถึงข้อมูลที่รวดเร็วสม่ำเสมอและโต้ตอบได้ บทนี้ครอบคลุมถึงประเภทของ OLAP การดำเนินการบน OLAP ความแตกต่างระหว่าง OLAP และฐานข้อมูลทางสถิติและ OLTP
ประเภทของเซิร์ฟเวอร์ OLAP
เรามีเซิร์ฟเวอร์ OLAP สี่ประเภท -
- OLAP เชิงสัมพันธ์ (ROLAP)
- OLAP หลายมิติ (MOLAP)
- OLAP ลูกผสม (HOLAP)
- เซิร์ฟเวอร์ SQL เฉพาะทาง
OLAP เชิงสัมพันธ์
เซิร์ฟเวอร์ ROLAP ถูกวางไว้ระหว่างเซิร์ฟเวอร์ส่วนหลังเชิงสัมพันธ์และเครื่องมือฟรอนต์เอนด์ของไคลเอ็นต์ ในการจัดเก็บและจัดการข้อมูลคลังสินค้า ROLAP ใช้ DBMS เชิงสัมพันธ์หรือแบบขยายความสัมพันธ์
ROLAP มีดังต่อไปนี้ -
- การใช้ตรรกะการนำทางแบบรวม
- การเพิ่มประสิทธิภาพสำหรับแบ็คเอนด์ DBMS แต่ละรายการ
- เครื่องมือและบริการเพิ่มเติม
OLAP หลายมิติ
MOLAP ใช้เอ็นจินการจัดเก็บข้อมูลหลายมิติตามอาร์เรย์สำหรับมุมมองข้อมูลหลายมิติ ด้วยการจัดเก็บข้อมูลหลายมิติการใช้พื้นที่จัดเก็บข้อมูลอาจต่ำหากชุดข้อมูลกระจัดกระจาย ดังนั้นเซิร์ฟเวอร์ MOLAP จำนวนมากจึงใช้การแสดงที่จัดเก็บข้อมูลสองระดับเพื่อจัดการชุดข้อมูลที่หนาแน่นและกระจัดกระจาย
OLAP แบบไฮบริด
Hybrid OLAP เป็นการผสมผสานระหว่าง ROLAP และ MOLAP มีความสามารถในการปรับขนาดของ ROLAP ที่สูงขึ้นและการคำนวณ MOLAP ที่เร็วขึ้น เซิร์ฟเวอร์ HOLAP อนุญาตให้จัดเก็บข้อมูลรายละเอียดจำนวนมาก การรวมจะถูกจัดเก็บแยกกันในร้าน MOLAP
เซิร์ฟเวอร์ SQL เฉพาะทาง
เซิร์ฟเวอร์ SQL เฉพาะทางให้ภาษาแบบสอบถามขั้นสูงและการสนับสนุนการประมวลผลแบบสอบถามสำหรับการสืบค้น SQL บนสคีมาแบบดาวและเกล็ดหิมะในสภาพแวดล้อมแบบอ่านอย่างเดียว
การดำเนินงาน OLAP
เนื่องจากเซิร์ฟเวอร์ OLAP ขึ้นอยู่กับมุมมองข้อมูลหลายมิติเราจะพูดถึงการทำงานของ OLAP ในข้อมูลหลายมิติ
นี่คือรายการของการดำเนินการ OLAP -
- Roll-up
- Drill-down
- หั่นลูกเต๋า
- Pivot (หมุน)
ม้วน
โรลอัพทำการรวมบนคิวบ์ข้อมูลด้วยวิธีใดวิธีหนึ่งดังต่อไปนี้ -
- โดยการไต่ลำดับชั้นของแนวคิดสำหรับมิติ
- โดยการลดขนาด
แผนภาพต่อไปนี้แสดงวิธีการทำงานของภาพรวม
การสะสมจะดำเนินการโดยการปีนลำดับชั้นแนวคิดสำหรับตำแหน่งมิติ
ในขั้นต้นลำดับชั้นของแนวคิดคือ "ถนน <เมือง <จังหวัด <ประเทศ"
ในการรวบรวมข้อมูลจะรวมโดยการเพิ่มขึ้นตามลำดับชั้นของสถานที่ตั้งจากระดับเมืองไปยังระดับของประเทศ
ข้อมูลจะถูกจัดกลุ่มเป็นเมืองมากกว่าประเทศ
เมื่อดำเนินการรวบรวมมิติข้อมูลอย่างน้อยหนึ่งมิติจากคิวบ์ข้อมูลจะถูกลบออก
เจาะลงไป
การดูรายละเอียดแบบเจาะลึกเป็นการดำเนินการย้อนกลับของภาพรวม ดำเนินการโดยวิธีใดวิธีหนึ่งดังต่อไปนี้ -
- โดยการลดลำดับชั้นแนวคิดสำหรับมิติ
- ด้วยการแนะนำมิติใหม่
แผนภาพต่อไปนี้แสดงให้เห็นถึงวิธีการทำงานแบบเจาะลึก -
การเจาะลึกจะดำเนินการโดยการลดลำดับชั้นของแนวคิดสำหรับเวลามิติ
ในขั้นต้นลำดับชั้นของแนวคิดคือ "วัน <เดือน <ไตรมาส <ปี"
ในการเจาะลึกมิติเวลาจะลดลงจากระดับของไตรมาสไปยังระดับของเดือน
เมื่อดำเนินการเจาะลึกมิติข้อมูลอย่างน้อยหนึ่งมิติจากคิวบ์ข้อมูลจะถูกเพิ่ม
นำทางข้อมูลจากข้อมูลที่มีรายละเอียดน้อยไปยังข้อมูลที่มีรายละเอียดสูง
ชิ้น
การดำเนินการ slice จะเลือกมิติใดมิติหนึ่งจากคิวบ์ที่กำหนดและจัดเตรียมคิวบ์ย่อยใหม่ พิจารณาแผนภาพต่อไปนี้ที่แสดงวิธีการทำงานของสไลซ์
ที่นี่ Slice ดำเนินการสำหรับมิติข้อมูล "เวลา" โดยใช้เกณฑ์เวลา = "Q1"
มันจะสร้างคิวบ์ย่อยใหม่โดยเลือกหนึ่งมิติขึ้นไป
ลูกเต๋า
Dice เลือกสองมิติหรือมากกว่าจากลูกบาศก์ที่กำหนดและจัดเตรียมลูกบาศก์ย่อยใหม่ พิจารณาแผนภาพต่อไปนี้ที่แสดงการทำงานของลูกเต๋า
การดำเนินการลูกเต๋าบนลูกบาศก์ตามเกณฑ์การเลือกต่อไปนี้เกี่ยวข้องกับสามมิติ
- (location = "Toronto" หรือ "Vancouver")
- (เวลา = "Q1" หรือ "Q2")
- (item = "Mobile" หรือ "Modem")
หมุน
การดำเนินการเดือยเรียกอีกอย่างว่าการหมุน มันจะหมุนแกนข้อมูลในมุมมองเพื่อให้เป็นทางเลือกในการนำเสนอข้อมูล พิจารณาแผนภาพต่อไปนี้ที่แสดงการทำงานของเดือย
OLAP กับ OLTP
ซีเนียร์ | คลังข้อมูล (OLAP) | ฐานข้อมูลปฏิบัติการ (OLTP) |
---|---|---|
1 | เกี่ยวข้องกับการประมวลผลข้อมูลในอดีต | เกี่ยวข้องกับการประมวลผลแบบวันต่อวัน |
2 | ระบบ OLAP ถูกใช้โดยผู้มีความรู้เช่นผู้บริหารผู้จัดการและนักวิเคราะห์ | เสมียน DBA หรือผู้เชี่ยวชาญด้านฐานข้อมูลใช้ระบบ OLTP |
3 | มีประโยชน์ในการวิเคราะห์ธุรกิจ | มีประโยชน์ในการดำเนินธุรกิจ |
4 | เน้นข้อมูลออก | มุ่งเน้นไปที่ข้อมูลใน. |
5 | ขึ้นอยู่กับ Star Schema, Snowflake, Schema และ Fact Constellation Schema | ขึ้นอยู่กับแบบจำลองความสัมพันธ์ของเอนทิตี |
6 | มีข้อมูลในอดีต | ประกอบด้วยข้อมูลปัจจุบัน |
7 | ให้ข้อมูลสรุปและรวม | ให้ข้อมูลดั้งเดิมและมีรายละเอียดสูง |
8 | ให้มุมมองข้อมูลสรุปและหลายมิติ | ให้มุมมองเชิงสัมพันธ์โดยละเอียดและราบเรียบของข้อมูล |
9 | จำนวนหรือผู้ใช้เป็นร้อย | จำนวนผู้ใช้เป็นพันคน |
10 | จำนวนบันทึกที่เข้าถึงเป็นล้าน | จำนวนบันทึกที่เข้าถึงเป็นสิบ |
11 | ขนาดฐานข้อมูลตั้งแต่ 100 GB ถึง 1 TB | ขนาดฐานข้อมูลตั้งแต่ 100 MB ถึง 1 GB |
12 | มีความยืดหยุ่นสูง | ให้ประสิทธิภาพสูง |