คลังข้อมูล - คำศัพท์
ในบทนี้เราจะพูดถึงคำศัพท์ที่ใช้บ่อยที่สุดในคลังข้อมูล
ข้อมูลเมตา
ข้อมูลเมตาถูกกำหนดให้เป็นข้อมูลเกี่ยวกับข้อมูล ข้อมูลที่ใช้เพื่อแสดงข้อมูลอื่นเรียกว่าข้อมูลเมตา ตัวอย่างเช่นดัชนีของหนังสือทำหน้าที่เป็นข้อมูลเมตาสำหรับเนื้อหาในหนังสือ กล่าวอีกนัยหนึ่งเราสามารถพูดได้ว่าข้อมูลเมตาคือข้อมูลสรุปที่นำเราไปสู่ข้อมูลโดยละเอียด
ในแง่ของคลังข้อมูลเราสามารถกำหนดเมทาดาทาได้ดังต่อไปนี้ -
ข้อมูลเมตาเป็นแผนที่เส้นทางไปยังคลังข้อมูล
ข้อมูลเมตาในคลังข้อมูลกำหนดออบเจ็กต์คลังสินค้า
ข้อมูลเมตาทำหน้าที่เป็นไดเร็กทอรี ไดเร็กทอรีนี้ช่วยระบบสนับสนุนการตัดสินใจในการค้นหาเนื้อหาของคลังข้อมูล
ที่เก็บข้อมูลเมตา
ที่เก็บข้อมูลเมตาเป็นส่วนหนึ่งของระบบคลังข้อมูล ประกอบด้วยข้อมูลเมตาต่อไปนี้ -
Business metadata - ประกอบด้วยข้อมูลการเป็นเจ้าของข้อมูลข้อกำหนดทางธุรกิจและนโยบายการเปลี่ยนแปลง
Operational metadata- รวมถึงสกุลเงินของข้อมูลและสายเลือดข้อมูล สกุลเงินของข้อมูลหมายถึงข้อมูลที่ใช้งานเก็บถาวรหรือถูกลบออก Lineage of data หมายถึงประวัติการย้ายข้อมูลและการเปลี่ยนแปลงที่ใช้กับข้อมูลนั้น
Data for mapping from operational environment to data warehouse - ข้อมูลเมตาประกอบด้วยฐานข้อมูลต้นทางและเนื้อหาการแยกข้อมูลพาร์ติชันข้อมูลการทำความสะอาดกฎการเปลี่ยนแปลงการรีเฟรชข้อมูลและกฎการล้างข้อมูล
The algorithms for summarization - ประกอบด้วยอัลกอริธึมมิติข้อมูลเกี่ยวกับรายละเอียดการรวมสรุปและอื่น ๆ
Data Cube
คิวบ์ข้อมูลช่วยให้เราแสดงข้อมูลในหลายมิติ ถูกกำหนดโดยมิติข้อมูลและข้อเท็จจริง มิติข้อมูลคือเอนทิตีที่องค์กรเก็บรักษาบันทึก
ภาพประกอบของ Data Cube
สมมติว่า บริษัท ต้องการติดตามบันทึกการขายโดยใช้คลังข้อมูลการขายเกี่ยวกับเวลารายการสาขาและสถานที่ มิติข้อมูลเหล่านี้ช่วยให้สามารถติดตามยอดขายรายเดือนและสาขาที่ขายสินค้าได้ มีตารางที่เกี่ยวข้องกับแต่ละมิติ ตารางนี้เรียกว่าตารางมิติ ตัวอย่างเช่นตารางมิติข้อมูล "item" อาจมีแอตทริบิวต์เช่น item_name, item_type และ item_brand
ตารางต่อไปนี้แสดงถึงมุมมอง 2 มิติของข้อมูลการขายสำหรับ บริษัท ที่เกี่ยวกับมิติเวลารายการและสถานที่ตั้ง
แต่ในตาราง 2 มิตินี้เรามีบันทึกเกี่ยวกับเวลาและรายการเท่านั้น ยอดขายสำหรับนิวเดลีจะแสดงตามเวลาและขนาดสินค้าตามประเภทของสินค้าที่ขาย หากเราต้องการดูข้อมูลการขายด้วยมิติข้อมูลเพิ่มเติมเช่นมิติที่ตั้งจากนั้นมุมมอง 3 มิติจะมีประโยชน์ มุมมอง 3 มิติของข้อมูลการขายเกี่ยวกับเวลาสินค้าและสถานที่แสดงในตารางด้านล่าง -
ตาราง 3 มิติด้านบนสามารถแสดงเป็นคิวบ์ข้อมูล 3 มิติได้ดังแสดงในรูปต่อไปนี้ -
ข้อมูลมาร์ท
มาร์ทข้อมูลประกอบด้วยชุดย่อยของข้อมูลทั้งองค์กรที่มีค่าสำหรับกลุ่มคนเฉพาะในองค์กร กล่าวอีกนัยหนึ่งดาต้ามาร์ทจะมีเฉพาะข้อมูลที่เฉพาะเจาะจงสำหรับกลุ่มใดกลุ่มหนึ่งเท่านั้น ตัวอย่างเช่นมาร์ทข้อมูลการตลาดอาจมีเฉพาะข้อมูลที่เกี่ยวข้องกับสินค้าลูกค้าและการขาย มาร์ทข้อมูลถูก จำกัด เฉพาะเรื่อง
ข้อควรจำเกี่ยวกับ Data Marts
เซิร์ฟเวอร์ที่ใช้ Windows หรือ Unix / Linux ใช้เพื่อติดตั้ง data marts มีการใช้งานบนเซิร์ฟเวอร์ต้นทุนต่ำ
วงจรการใช้งานดาต้ามาร์ทถูกวัดในช่วงเวลาสั้น ๆ กล่าวคือเป็นสัปดาห์แทนที่จะเป็นเดือนหรือปี
วงจรชีวิตของ data marts อาจมีความซับซ้อนในระยะยาวหากการวางแผนและการออกแบบไม่ครอบคลุมทั้งองค์กร
มาร์ทข้อมูลมีขนาดเล็ก
มาร์ทข้อมูลได้รับการปรับแต่งตามแผนก
แหล่งที่มาของดาต้ามาร์ทคือคลังข้อมูลที่มีโครงสร้างแบบแผนก
มาร์ทข้อมูลมีความยืดหยุ่น
รูปต่อไปนี้แสดงการแสดงกราฟิกของ data marts
คลังสินค้าเสมือน
มุมมองของคลังข้อมูลการดำเนินงานเรียกว่าคลังสินค้าเสมือน การสร้างคลังสินค้าเสมือนเป็นเรื่องง่าย การสร้างคลังสินค้าเสมือนจำเป็นต้องใช้ความจุส่วนเกินบนเซิร์ฟเวอร์ฐานข้อมูลปฏิบัติการ