คลังข้อมูล - ภาพรวม
คำว่า "คลังข้อมูล" ได้รับการประกาศเกียรติคุณเป็นครั้งแรกโดย Bill Inmon ในปี 1990 จากข้อมูลของ Inmon คลังข้อมูลคือการรวบรวมข้อมูลที่มุ่งเน้นเชิงบูรณาการตัวแปรเวลาและไม่ลบเลือน ข้อมูลนี้ช่วยให้นักวิเคราะห์สามารถตัดสินใจอย่างชาญฉลาดในองค์กร
ฐานข้อมูลการดำเนินงานมีการเปลี่ยนแปลงบ่อยในแต่ละวันเนื่องจากธุรกรรมที่เกิดขึ้น สมมติว่าผู้บริหารธุรกิจต้องการวิเคราะห์ความคิดเห็นก่อนหน้าเกี่ยวกับข้อมูลใด ๆ เช่นผลิตภัณฑ์ซัพพลายเออร์หรือข้อมูลผู้บริโภคใด ๆ ผู้บริหารจะไม่มีข้อมูลให้วิเคราะห์เนื่องจากข้อมูลก่อนหน้านี้ได้รับการอัปเดตเนื่องจากการทำธุรกรรม
คลังข้อมูลให้ข้อมูลทั่วไปและข้อมูลรวมในมุมมองหลายมิติ นอกเหนือจากมุมมองข้อมูลทั่วไปและแบบรวมแล้วคลังข้อมูลยังมีเครื่องมือ Online Analytical Processing (OLAP) ให้เราอีกด้วย เครื่องมือเหล่านี้ช่วยเราในการวิเคราะห์ข้อมูลเชิงโต้ตอบและมีประสิทธิภาพในพื้นที่หลายมิติ การวิเคราะห์นี้ส่งผลให้เกิดข้อมูลทั่วไปและการขุดข้อมูล
ฟังก์ชันการขุดข้อมูลเช่นการเชื่อมโยงการทำคลัสเตอร์การจัดหมวดหมู่การทำนายสามารถรวมเข้ากับการดำเนินการของ OLAP เพื่อเพิ่มการขุดหาความรู้เชิงโต้ตอบในหลายระดับของนามธรรม นั่นเป็นเหตุผลที่ตอนนี้คลังข้อมูลกลายเป็นแพลตฟอร์มสำคัญสำหรับการวิเคราะห์ข้อมูลและการประมวลผลเชิงวิเคราะห์ออนไลน์
การทำความเข้าใจคลังข้อมูล
คลังข้อมูลคือฐานข้อมูลซึ่งแยกออกจากฐานข้อมูลการปฏิบัติงานขององค์กร
ไม่มีการอัปเดตบ่อยครั้งในคลังข้อมูล
มีข้อมูลในอดีตที่รวมเข้าด้วยกันซึ่งช่วยให้องค์กรสามารถวิเคราะห์ธุรกิจได้
คลังข้อมูลช่วยให้ผู้บริหารจัดระเบียบทำความเข้าใจและใช้ข้อมูลเพื่อตัดสินใจเชิงกลยุทธ์
ระบบคลังข้อมูลช่วยในการผสมผสานความหลากหลายของระบบแอปพลิเคชัน
ระบบคลังข้อมูลช่วยในการวิเคราะห์ข้อมูลย้อนหลังแบบรวม
เหตุใดคลังข้อมูลจึงแยกออกจากฐานข้อมูลเชิงปฏิบัติการ
คลังข้อมูลจะแยกออกจากฐานข้อมูลการดำเนินงานเนื่องจากเหตุผลดังต่อไปนี้ -
ฐานข้อมูลการปฏิบัติงานถูกสร้างขึ้นสำหรับงานและปริมาณงานที่เป็นที่รู้จักเช่นการค้นหาเรกคอร์ดโดยเฉพาะการจัดทำดัชนีเป็นต้นในสัญญาการสืบค้นคลังข้อมูลมักจะซับซ้อนและนำเสนอรูปแบบข้อมูลทั่วไป
ฐานข้อมูลเชิงปฏิบัติการสนับสนุนการประมวลผลธุรกรรมหลายรายการพร้อมกัน จำเป็นต้องมีกลไกการควบคุมและการกู้คืนพร้อมกันสำหรับฐานข้อมูลปฏิบัติการเพื่อให้มั่นใจว่าฐานข้อมูลมีความแข็งแรงและสอดคล้องกัน
แบบสอบถามฐานข้อมูลการดำเนินงานอนุญาตให้อ่านและแก้ไขการดำเนินการในขณะที่แบบสอบถาม OLAP ต้องการเท่านั้น read only การเข้าถึงข้อมูลที่จัดเก็บ
ฐานข้อมูลการปฏิบัติงานเก็บรักษาข้อมูลปัจจุบัน ในทางกลับกันคลังข้อมูลจะเก็บรักษาข้อมูลในอดีต
คุณสมบัติคลังข้อมูล
คุณสมบัติที่สำคัญของคลังข้อมูลจะกล่าวถึงด้านล่าง -
Subject Oriented- คลังข้อมูลเป็นเรื่องที่มุ่งเน้นเนื่องจากให้ข้อมูลเกี่ยวกับหัวเรื่องมากกว่าการดำเนินงานต่อเนื่องขององค์กร หัวข้อเหล่านี้อาจเป็นผลิตภัณฑ์ลูกค้าซัพพลายเออร์การขายรายได้ ฯลฯ คลังข้อมูลไม่ได้มุ่งเน้นไปที่การดำเนินงานต่อเนื่อง แต่มุ่งเน้นไปที่การสร้างแบบจำลองและการวิเคราะห์ข้อมูลเพื่อการตัดสินใจ
Integrated - คลังข้อมูลสร้างขึ้นโดยการรวมข้อมูลจากแหล่งที่มาที่แตกต่างกันเช่นฐานข้อมูลเชิงสัมพันธ์ไฟล์แบบแบนเป็นต้นการรวมเข้าด้วยกันนี้ช่วยเพิ่มประสิทธิภาพในการวิเคราะห์ข้อมูล
Time Variant- ข้อมูลที่รวบรวมในคลังข้อมูลจะถูกระบุด้วยช่วงเวลาหนึ่ง ๆ ข้อมูลในคลังข้อมูลให้ข้อมูลจากมุมมองในอดีต
Non-volatile- ไม่ลบเลือนหมายความว่าข้อมูลก่อนหน้านี้จะไม่ถูกลบเมื่อมีการเพิ่มข้อมูลใหม่เข้าไป คลังข้อมูลจะถูกเก็บแยกจากฐานข้อมูลการปฏิบัติงานดังนั้นการเปลี่ยนแปลงฐานข้อมูลการปฏิบัติงานบ่อยครั้งจึงไม่สะท้อนให้เห็นในคลังข้อมูล
Note - คลังข้อมูลไม่จำเป็นต้องมีการประมวลผลธุรกรรมการกู้คืนและการควบคุมภาวะพร้อมกันเนื่องจากมีการจัดเก็บทางกายภาพและแยกจากฐานข้อมูลการปฏิบัติงาน
แอปพลิเคชันคลังข้อมูล
ตามที่กล่าวไว้ก่อนหน้านี้คลังข้อมูลช่วยให้ผู้บริหารทางธุรกิจสามารถจัดระเบียบวิเคราะห์และใช้ข้อมูลเพื่อการตัดสินใจ คลังข้อมูลทำหน้าที่เป็นส่วนเดียวของระบบป้อนกลับแบบประเมิน "วงปิด" สำหรับการจัดการองค์กร คลังข้อมูลใช้กันอย่างแพร่หลายในสาขาต่อไปนี้ -
- บริการทางการเงิน
- บริการด้านการธนาคาร
- เครื่องอุปโภคบริโภค
- ภาคการค้าปลีก
- ควบคุมการผลิต
ประเภทของคลังข้อมูล
การประมวลผลข้อมูลการประมวลผลเชิงวิเคราะห์และการขุดข้อมูลเป็นแอปพลิเคชันคลังข้อมูลสามประเภทที่จะกล่าวถึงด้านล่าง -
Information Processing- คลังข้อมูลอนุญาตให้ประมวลผลข้อมูลที่เก็บไว้ในนั้น ข้อมูลสามารถประมวลผลได้ด้วยวิธีการสืบค้นการวิเคราะห์ทางสถิติพื้นฐานการรายงานโดยใช้แท็บตารางตารางแผนภูมิหรือกราฟ
Analytical Processing- คลังข้อมูลรองรับการประมวลผลเชิงวิเคราะห์ของข้อมูลที่จัดเก็บไว้ในนั้น ข้อมูลสามารถวิเคราะห์ได้ด้วยวิธีการดำเนินการพื้นฐานของ OLAP ซึ่งรวมถึงการสไลซ์และลูกเต๋าการเจาะลึกการเจาะลึกและการหมุน
Data Mining- การขุดข้อมูลสนับสนุนการค้นพบความรู้โดยการค้นหารูปแบบและการเชื่อมโยงที่ซ่อนอยู่การสร้างแบบจำลองการวิเคราะห์การจำแนกประเภทและการทำนาย ผลการขุดเหล่านี้สามารถนำเสนอโดยใช้เครื่องมือสร้างภาพ
ซีเนียร์ | คลังข้อมูล (OLAP) | ฐานข้อมูลปฏิบัติการ (OLTP) |
---|---|---|
1 | เกี่ยวข้องกับการประมวลผลข้อมูลในอดีต | มันเกี่ยวข้องกับการประมวลผลแบบวันต่อวัน |
2 | ระบบ OLAP ถูกใช้โดยผู้มีความรู้เช่นผู้บริหารผู้จัดการและนักวิเคราะห์ | เสมียน DBA หรือผู้เชี่ยวชาญด้านฐานข้อมูลใช้ระบบ OLTP |
3 | ใช้ในการวิเคราะห์ธุรกิจ | ใช้ในการดำเนินธุรกิจ |
4 | เน้นข้อมูลออก | มุ่งเน้นไปที่ข้อมูลใน. |
5 | มันขึ้นอยู่กับ Star Schema, Snowflake Schema และ Fact Constellation Schema | มันขึ้นอยู่กับ Entity Relationship Model |
6 | เน้นข้อมูลออก | เป็นแอปพลิเคชันที่มุ่งเน้น |
7 | มีข้อมูลในอดีต | ประกอบด้วยข้อมูลปัจจุบัน |
8 | ให้ข้อมูลสรุปและรวม | ให้ข้อมูลดั้งเดิมและมีรายละเอียดสูง |
9 | ให้มุมมองข้อมูลสรุปและหลายมิติ | ให้มุมมองเชิงสัมพันธ์ที่ละเอียดและแบนของข้อมูล |
10 | จำนวนผู้ใช้เป็นร้อย | จำนวนผู้ใช้เป็นหลักพัน |
11 | จำนวนบันทึกที่เข้าถึงเป็นล้าน | จำนวนบันทึกที่เข้าถึงมีหน่วยเป็นสิบ |
12 | ขนาดฐานข้อมูลตั้งแต่ 100GB ถึง 100 TB | ขนาดฐานข้อมูลตั้งแต่ 100 MB ถึง 100 GB |
13 | สิ่งเหล่านี้มีความยืดหยุ่นสูง | ให้ประสิทธิภาพสูง |