Apache Xerces - ภาพรวม DOM Parser

Document Object Model เป็นคำแนะนำอย่างเป็นทางการของ World Wide Web Consortium (W3C) กำหนดอินเทอร์เฟซที่ช่วยให้โปรแกรมสามารถเข้าถึงและอัปเดตสไตล์โครงสร้างและเนื้อหาของเอกสาร XML ตัวแยกวิเคราะห์ XML ที่สนับสนุน DOM ใช้อินเทอร์เฟซนั้น

ใช้เมื่อไหร่?

คุณควรใช้ตัวแยกวิเคราะห์ DOM เมื่อ -

  • คุณจำเป็นต้องรู้มากเกี่ยวกับโครงสร้างของเอกสาร

  • คุณต้องย้ายส่วนต่างๆของเอกสารไปรอบ ๆ (คุณอาจต้องการจัดเรียงองค์ประกอบบางอย่างเป็นต้น)

  • คุณจำเป็นต้องใช้ข้อมูลในเอกสารมากกว่าหนึ่งครั้ง

สิ่งที่คุณได้รับ?

เมื่อคุณแยกวิเคราะห์เอกสาร XML ด้วยตัวแยกวิเคราะห์ DOM คุณจะได้รับโครงสร้างแผนผังที่มีองค์ประกอบทั้งหมดของเอกสารของคุณกลับคืนมา DOM มีฟังก์ชันมากมายที่คุณสามารถใช้เพื่อตรวจสอบเนื้อหาและโครงสร้างของเอกสาร

ข้อดี

DOM เป็นอินเทอร์เฟซทั่วไปสำหรับจัดการโครงสร้างเอกสาร หนึ่งในเป้าหมายการออกแบบคือโค้ด Java ที่เขียนขึ้นสำหรับตัวแยกวิเคราะห์ที่สอดคล้องกับ DOM หนึ่งตัวควรทำงานบนตัวแยกวิเคราะห์ที่สอดคล้องกับ DOM โดยไม่มีการเปลี่ยนแปลง

อินเทอร์เฟซ DOM

DOM กำหนดอินเตอร์เฟส Java หลายรายการ นี่คืออินเทอร์เฟซที่พบบ่อยที่สุด -

  • Node - ประเภทข้อมูลพื้นฐานของ DOM

  • Element - วัตถุส่วนใหญ่ที่คุณจะจัดการคือองค์ประกอบ

  • Attr - แสดงถึงคุณลักษณะขององค์ประกอบ

  • Text - เนื้อหาจริงขององค์ประกอบหรือ Attr

  • Document- แสดงถึงเอกสาร XML ทั้งหมด วัตถุเอกสารมักเรียกว่าโครงสร้าง DOM

วิธี DOM ทั่วไป

เมื่อคุณทำงานกับ DOM มีหลายวิธีที่ใช้บ่อย -

  • Document.getDocumentElement() - ส่งคืนองค์ประกอบรากของเอกสาร

  • Node.getFirstChild() - ส่งคืนลูกคนแรกของโหนดที่กำหนด

  • Node.getLastChild() - ส่งคืนลูกสุดท้ายของโหนดที่กำหนด

  • Node.getNextSibling() - วิธีการเหล่านี้ส่งคืนพี่น้องถัดไปของโหนดที่กำหนด

  • Node.getPreviousSibling() - วิธีการเหล่านี้ส่งคืนพี่น้องก่อนหน้าของโหนดที่กำหนด

  • Node.getAttribute(attrName) - สำหรับโหนดที่ระบุให้ส่งคืนแอตทริบิวต์พร้อมชื่อที่ร้องขอ