SAP HANA - การสร้างโปรไฟล์ข้อมูล SQL

งาน SQL Data Profiling ใช้เพื่อทำความเข้าใจและวิเคราะห์ข้อมูลจากแหล่งข้อมูลหลายแหล่ง ใช้เพื่อลบข้อมูลที่ไม่ถูกต้องไม่สมบูรณ์และป้องกันปัญหาคุณภาพของข้อมูลก่อนที่จะโหลดในคลังข้อมูล

นี่คือประโยชน์ของงานการจัดทำโปรไฟล์ข้อมูล SQL -

  • ช่วยในการวิเคราะห์แหล่งข้อมูลได้อย่างมีประสิทธิภาพมากขึ้น

  • ช่วยในการทำความเข้าใจแหล่งข้อมูลได้ดีขึ้น

  • จะลบข้อมูลที่ไม่ถูกต้องไม่สมบูรณ์และปรับปรุงคุณภาพข้อมูลก่อนที่จะโหลดลงในคลังข้อมูล

  • ใช้กับงาน Extraction, Transformation และ Loading

งานการจัดทำโปรไฟล์ข้อมูลจะตรวจสอบโปรไฟล์ที่ช่วยในการทำความเข้าใจแหล่งข้อมูลและระบุปัญหาในข้อมูลที่ต้องได้รับการแก้ไข

คุณสามารถใช้งานการทำโปรไฟล์ข้อมูลภายในแพ็กเกจ Integration Services กับข้อมูลโปรไฟล์ที่เก็บไว้ใน SQL Server และเพื่อระบุปัญหาที่อาจเกิดขึ้นกับคุณภาพของข้อมูล

Note - งานการจัดทำโปรไฟล์ข้อมูลทำงานได้เฉพาะกับแหล่งข้อมูล SQL Server และไม่สนับสนุนไฟล์อื่น ๆ ที่อ้างอิงจากแหล่งข้อมูลหรือจากบุคคลที่สาม

ข้อกำหนดการเข้าถึง

ในการรันแพ็กเกจที่มีงานการทำโปรไฟล์ข้อมูลบัญชีผู้ใช้ต้องมีสิทธิ์ในการอ่าน / เขียนด้วยสิทธิ์ CREATE TABLE บนฐานข้อมูล tempdb

ผู้ดู Data Profiler

Data Profile Viewer ใช้เพื่อตรวจสอบเอาต์พุตของ profiler นอกจากนี้ Data Profile Viewer ยังรองรับความสามารถในการเจาะลึกเพื่อช่วยให้คุณเข้าใจปัญหาคุณภาพของข้อมูลที่ระบุไว้ในเอาต์พุตโปรไฟล์ ความสามารถในการเจาะลึกนี้จะส่งแบบสอบถามสดไปยังแหล่งข้อมูลดั้งเดิม

การตั้งค่าและตรวจสอบงานการทำโปรไฟล์ข้อมูล

การตั้งค่างานการทำโปรไฟล์ข้อมูล

มันเกี่ยวข้องกับการเรียกใช้แพ็กเกจที่มีงานการทำโปรไฟล์ข้อมูลเพื่อคำนวณโปรไฟล์ งานบันทึกเอาต์พุตในรูปแบบ XML ลงในไฟล์หรือตัวแปรแพ็กเกจ

การตรวจสอบโปรไฟล์

ในการดูโปรไฟล์ข้อมูลให้ส่งเอาต์พุตไปยังไฟล์จากนั้นใช้ Data Profile Viewer วิวเวอร์นี้เป็นยูทิลิตี้แบบสแตนด์อะโลนที่แสดงเอาต์พุตโปรไฟล์ทั้งในรูปแบบสรุปและรูปแบบรายละเอียดพร้อมความสามารถในการเจาะลึกเพิ่มเติม

การทำโปรไฟล์ข้อมูล - ตัวเลือกการกำหนดค่า

งานการจัดทำโปรไฟล์ข้อมูลมีตัวเลือกการกำหนดค่าที่สะดวกเหล่านี้ -

คอลัมน์สัญลักษณ์แทน

ขณะกำหนดค่าการร้องขอโปรไฟล์งานจะยอมรับสัญลักษณ์แทน '*' แทนชื่อคอลัมน์ ซึ่งจะช่วยลดความซับซ้อนของการกำหนดค่าและช่วยให้ค้นพบลักษณะของข้อมูลที่ไม่คุ้นเคยได้ง่ายขึ้น เมื่องานรันงานโปรไฟล์ทุกคอลัมน์ที่มีชนิดข้อมูลที่เหมาะสม

โปรไฟล์ด่วน

คุณสามารถเลือกโปรไฟล์ด่วนเพื่อกำหนดค่างานได้อย่างรวดเร็ว โปรไฟล์ด่วนโปรไฟล์ตารางหรือมุมมองโดยใช้โปรไฟล์และการตั้งค่าเริ่มต้นทั้งหมด

งานการจัดทำโปรไฟล์ข้อมูลสามารถคำนวณโปรไฟล์ข้อมูลที่แตกต่างกันแปดโปรไฟล์ ห้าโปรไฟล์เหล่านี้สามารถตรวจสอบแต่ละคอลัมน์และอีกสามคอลัมน์ที่เหลือวิเคราะห์คอลัมน์หรือความสัมพันธ์ระหว่างคอลัมน์

การสร้างโปรไฟล์ข้อมูล - ผลลัพธ์ของงาน

งาน Data Profiling จะส่งออกโปรไฟล์ที่เลือกเป็นรูปแบบ XML ที่มีโครงสร้างเหมือนกับสคีมา DataProfile.xsd

คุณสามารถบันทึกสำเนาสคีมาในเครื่องและดูสำเนาภายในของสคีมาใน Microsoft Visual Studio หรือโปรแกรมแก้ไขสคีมาอื่นในตัวแก้ไข XML หรือในโปรแกรมแก้ไขข้อความเช่น Notepad