SAP HANA - การสร้างโปรไฟล์ข้อมูล SQL
งาน SQL Data Profiling ใช้เพื่อทำความเข้าใจและวิเคราะห์ข้อมูลจากแหล่งข้อมูลหลายแหล่ง ใช้เพื่อลบข้อมูลที่ไม่ถูกต้องไม่สมบูรณ์และป้องกันปัญหาคุณภาพของข้อมูลก่อนที่จะโหลดในคลังข้อมูล
นี่คือประโยชน์ของงานการจัดทำโปรไฟล์ข้อมูล SQL -
ช่วยในการวิเคราะห์แหล่งข้อมูลได้อย่างมีประสิทธิภาพมากขึ้น
ช่วยในการทำความเข้าใจแหล่งข้อมูลได้ดีขึ้น
จะลบข้อมูลที่ไม่ถูกต้องไม่สมบูรณ์และปรับปรุงคุณภาพข้อมูลก่อนที่จะโหลดลงในคลังข้อมูล
ใช้กับงาน Extraction, Transformation และ Loading
งานการจัดทำโปรไฟล์ข้อมูลจะตรวจสอบโปรไฟล์ที่ช่วยในการทำความเข้าใจแหล่งข้อมูลและระบุปัญหาในข้อมูลที่ต้องได้รับการแก้ไข
คุณสามารถใช้งานการทำโปรไฟล์ข้อมูลภายในแพ็กเกจ Integration Services กับข้อมูลโปรไฟล์ที่เก็บไว้ใน SQL Server และเพื่อระบุปัญหาที่อาจเกิดขึ้นกับคุณภาพของข้อมูล
Note - งานการจัดทำโปรไฟล์ข้อมูลทำงานได้เฉพาะกับแหล่งข้อมูล SQL Server และไม่สนับสนุนไฟล์อื่น ๆ ที่อ้างอิงจากแหล่งข้อมูลหรือจากบุคคลที่สาม
ข้อกำหนดการเข้าถึง
ในการรันแพ็กเกจที่มีงานการทำโปรไฟล์ข้อมูลบัญชีผู้ใช้ต้องมีสิทธิ์ในการอ่าน / เขียนด้วยสิทธิ์ CREATE TABLE บนฐานข้อมูล tempdb
ผู้ดู Data Profiler
Data Profile Viewer ใช้เพื่อตรวจสอบเอาต์พุตของ profiler นอกจากนี้ Data Profile Viewer ยังรองรับความสามารถในการเจาะลึกเพื่อช่วยให้คุณเข้าใจปัญหาคุณภาพของข้อมูลที่ระบุไว้ในเอาต์พุตโปรไฟล์ ความสามารถในการเจาะลึกนี้จะส่งแบบสอบถามสดไปยังแหล่งข้อมูลดั้งเดิม
การตั้งค่าและตรวจสอบงานการทำโปรไฟล์ข้อมูล
การตั้งค่างานการทำโปรไฟล์ข้อมูล
มันเกี่ยวข้องกับการเรียกใช้แพ็กเกจที่มีงานการทำโปรไฟล์ข้อมูลเพื่อคำนวณโปรไฟล์ งานบันทึกเอาต์พุตในรูปแบบ XML ลงในไฟล์หรือตัวแปรแพ็กเกจ
การตรวจสอบโปรไฟล์
ในการดูโปรไฟล์ข้อมูลให้ส่งเอาต์พุตไปยังไฟล์จากนั้นใช้ Data Profile Viewer วิวเวอร์นี้เป็นยูทิลิตี้แบบสแตนด์อะโลนที่แสดงเอาต์พุตโปรไฟล์ทั้งในรูปแบบสรุปและรูปแบบรายละเอียดพร้อมความสามารถในการเจาะลึกเพิ่มเติม
การทำโปรไฟล์ข้อมูล - ตัวเลือกการกำหนดค่า
งานการจัดทำโปรไฟล์ข้อมูลมีตัวเลือกการกำหนดค่าที่สะดวกเหล่านี้ -
คอลัมน์สัญลักษณ์แทน
ขณะกำหนดค่าการร้องขอโปรไฟล์งานจะยอมรับสัญลักษณ์แทน '*' แทนชื่อคอลัมน์ ซึ่งจะช่วยลดความซับซ้อนของการกำหนดค่าและช่วยให้ค้นพบลักษณะของข้อมูลที่ไม่คุ้นเคยได้ง่ายขึ้น เมื่องานรันงานโปรไฟล์ทุกคอลัมน์ที่มีชนิดข้อมูลที่เหมาะสม
โปรไฟล์ด่วน
คุณสามารถเลือกโปรไฟล์ด่วนเพื่อกำหนดค่างานได้อย่างรวดเร็ว โปรไฟล์ด่วนโปรไฟล์ตารางหรือมุมมองโดยใช้โปรไฟล์และการตั้งค่าเริ่มต้นทั้งหมด
งานการจัดทำโปรไฟล์ข้อมูลสามารถคำนวณโปรไฟล์ข้อมูลที่แตกต่างกันแปดโปรไฟล์ ห้าโปรไฟล์เหล่านี้สามารถตรวจสอบแต่ละคอลัมน์และอีกสามคอลัมน์ที่เหลือวิเคราะห์คอลัมน์หรือความสัมพันธ์ระหว่างคอลัมน์
การสร้างโปรไฟล์ข้อมูล - ผลลัพธ์ของงาน
งาน Data Profiling จะส่งออกโปรไฟล์ที่เลือกเป็นรูปแบบ XML ที่มีโครงสร้างเหมือนกับสคีมา DataProfile.xsd
คุณสามารถบันทึกสำเนาสคีมาในเครื่องและดูสำเนาภายในของสคีมาใน Microsoft Visual Studio หรือโปรแกรมแก้ไขสคีมาอื่นในตัวแก้ไข XML หรือในโปรแกรมแก้ไขข้อความเช่น Notepad