คลังข้อมูล - คำถามสัมภาษณ์
เรียนผู้อ่านเหล่านี้ Data Warehousing Interview Questions ได้รับการออกแบบมาโดยเฉพาะเพื่อให้คุณคุ้นเคยกับลักษณะของคำถามที่คุณอาจพบในระหว่างการสัมภาษณ์ในหัวข้อนี้ Data Warehousing.
A : คลังข้อมูลคือการรวบรวมข้อมูลที่มุ่งเน้นบูรณาการตัวแปรตามเวลาและไม่ลบเลือนซึ่งสนับสนุนกระบวนการตัดสินใจของผู้บริหาร
A : หัวข้อที่มุ่งเน้นหมายถึงคลังข้อมูลจัดเก็บข้อมูลเกี่ยวกับเรื่องใดเรื่องหนึ่งเช่นผลิตภัณฑ์ลูกค้าการขายเป็นต้น
A : แอพพลิเคชั่นบางอย่างรวมถึงบริการทางการเงินบริการธนาคารสินค้าของลูกค้าภาคการค้าปลีกการควบคุมการผลิต
A : OLAP เป็นคำย่อของ Online Analytical Processing และ OLTP เป็นคำย่อของการประมวลผลธุรกรรมออนไลน์
A : คลังข้อมูลประกอบด้วยข้อมูลประวัติที่จัดทำขึ้นเพื่อการวิเคราะห์ธุรกิจในขณะที่ฐานข้อมูลการดำเนินงานประกอบด้วยข้อมูลปัจจุบันที่จำเป็นในการดำเนินธุรกิจ
A : คลังข้อมูลสามารถใช้สคีมาดาวสคีมาเกล็ดหิมะและสคีมากลุ่มดาวได้
A : Data Warehousing คือกระบวนการสร้างและใช้คลังข้อมูล
A : Data Warehousing เกี่ยวข้องกับการล้างข้อมูลการรวมข้อมูลและการรวมข้อมูล
A : ฟังก์ชันที่ดำเนินการโดยเครื่องมือคลังข้อมูลและยูทิลิตี้ ได้แก่ การสกัดข้อมูลการทำความสะอาดข้อมูลการแปลงข้อมูลการโหลดข้อมูลและการรีเฟรช
A : การแยกข้อมูลหมายถึงการรวบรวมข้อมูลจากแหล่งที่มาที่แตกต่างกันหลายแหล่ง
A: ข้อมูลเมตาถูกกำหนดให้เป็นข้อมูลเกี่ยวกับข้อมูล กล่าวอีกนัยหนึ่งเราสามารถพูดได้ว่าข้อมูลเมตาคือข้อมูลสรุปที่นำเราไปสู่ข้อมูลโดยละเอียด
A : ระบบทางเดินหายใจของข้อมูลเมตาประกอบด้วยคำจำกัดความของคลังข้อมูลข้อมูลเมตาของธุรกิจข้อมูลเมตาในการดำเนินงานข้อมูลสำหรับการทำแผนที่จากสภาพแวดล้อมการปฏิบัติงานไปยังคลังข้อมูลและอัลกอริทึมสำหรับการสรุป
A: คิวบ์ข้อมูลช่วยให้เราแสดงข้อมูลในหลายมิติ คิวบ์ข้อมูลถูกกำหนดโดยมิติข้อมูลและข้อเท็จจริง
A : มิติคือเอนทิตีที่องค์กรเก็บบันทึกไว้
A: Data mart มีข้อมูลย่อยทั้งองค์กร ข้อมูลชุดย่อยนี้มีค่าสำหรับกลุ่มเฉพาะขององค์กร กล่าวอีกนัยหนึ่งเราสามารถพูดได้ว่าดาต้ามาร์ทมีข้อมูลเฉพาะสำหรับกลุ่มใดกลุ่มหนึ่ง
A : มุมมองของคลังข้อมูลการดำเนินงานเรียกว่าคลังสินค้าเสมือน
A : ขั้นตอนต่างๆ ได้แก่ กลยุทธ์ด้านไอทีการศึกษาการวิเคราะห์กรณีธุรกิจพิมพ์เขียวทางเทคนิคสร้างเวอร์ชันโหลดประวัติแบบสอบถามเฉพาะกิจวิวัฒนาการความต้องการระบบอัตโนมัติและขอบเขตการขยาย
A: ตัวจัดการโหลดดำเนินการตามที่จำเป็นในการแยกและโหลดกระบวนการ ขนาดและความซับซ้อนของ load manager แตกต่างกันไประหว่างโซลูชันเฉพาะจากคลังข้อมูลไปจนถึงคลังข้อมูล
A: ตัวจัดการโหลดจะดึงข้อมูลจากระบบต้นทาง โหลดข้อมูลที่แยกแล้วลงในที่เก็บข้อมูลชั่วคราวอย่างรวดเร็ว ทำการแปลงอย่างง่ายให้เป็นโครงสร้างที่คล้ายกับโครงสร้างในคลังข้อมูล
A: ผู้จัดการคลังสินค้ารับผิดชอบกระบวนการจัดการคลังสินค้า ผู้จัดการคลังสินค้าประกอบด้วยซอฟต์แวร์ระบบของบุคคลที่สามโปรแกรม C และเชลล์สคริปต์ ขนาดและความซับซ้อนของผู้จัดการคลังสินค้าแตกต่างกันไปตามโซลูชันเฉพาะ
A : ผู้จัดการคลังสินค้าดำเนินการตรวจสอบความสอดคล้องและความสมบูรณ์ของการอ้างอิงสร้างดัชนีมุมมองทางธุรกิจมุมมองพาร์ติชันกับข้อมูลพื้นฐานแปลงและรวมข้อมูลต้นทางลงในที่จัดเก็บชั่วคราวในคลังข้อมูลที่เผยแพร่สำรองข้อมูลในคลังข้อมูล และเก็บข้อมูลที่หมดอายุการใช้งาน
A : ข้อมูลสรุปคือพื้นที่ในคลังข้อมูลที่เก็บการรวมที่กำหนดไว้ล่วงหน้า
A : Query Manager มีหน้าที่กำหนดคิวรีไปยังตารางที่เหมาะสม
A : เซิร์ฟเวอร์ OLAP มีอยู่สี่ประเภท ได้แก่ Relational OLAP, Multidimensional OLAP, Hybrid OLAP และ Specialized SQL Servers
A : OLAP หลายมิติเร็วกว่า Relational OLAP
A : OLAP ทำหน้าที่ต่างๆเช่นโรลอัพเจาะลึกสไลซ์ลูกเต๋าและเดือย
A : เลือกเพียงมิติเดียวสำหรับการดำเนินการสไลซ์
A : สำหรับการดำเนินการลูกเต๋าสองมิติขึ้นไปจะถูกเลือกสำหรับลูกบาศก์ที่กำหนด
A : มีตารางข้อเท็จจริงเพียงตารางเดียวในสคีมารูปดาว
A : Normalization จะแยกข้อมูลออกเป็นตารางเพิ่มเติม
A : Snowflake schema ใช้แนวคิดของการทำให้เป็นมาตรฐาน
A : Normalization ช่วยในการลดความซ้ำซ้อนของข้อมูล
A : Data Mining Query Language (DMQL) ใช้สำหรับ Schema Definition
A : DMQL อิงตาม Structured Query Language (SQL)
A : การแบ่งพาร์ติชันทำได้ด้วยเหตุผลหลายประการเช่นการจัดการที่ง่ายเพื่อช่วยในการกู้คืนข้อมูลสำรองเพื่อเพิ่มประสิทธิภาพ
A : Data Marting เกี่ยวข้องกับต้นทุนฮาร์ดแวร์และซอฟต์แวร์ต้นทุนการเข้าถึงเครือข่ายและต้นทุนเวลา