XML - เอนทิตีอักขระ
บทนี้อธิบาย XML Character Entities. ก่อนที่เราจะเข้าใจ Character Entities ให้เราเข้าใจก่อนว่าเอนทิตี XML คืออะไร
ตามที่W3 Consortiumกำหนดความหมายของเอนทิตีมีดังนี้ -
"เอนทิตีเอกสารทำหน้าที่เป็นรากของทรีเอนทิตีและเป็นจุดเริ่มต้นสำหรับตัวประมวลผล XML"
ซึ่งหมายความว่าเอนทิตีคือตัวยึดตำแหน่งใน XML สิ่งเหล่านี้สามารถประกาศได้ในเอกสาร prolog หรือใน DTD เอนทิตีมีหลายประเภทและในบทนี้เราจะพูดถึงเอนทิตีตัวละคร
ทั้ง HTML และ XML มีสัญลักษณ์บางอย่างที่สงวนไว้สำหรับการใช้งานซึ่งไม่สามารถใช้เป็นเนื้อหาในโค้ด XML ได้ ตัวอย่างเช่น,< และ >ป้ายใช้สำหรับเปิดและปิดแท็ก XML ในการแสดงอักขระพิเศษเหล่านี้จะใช้เอนทิตีอักขระ
มีอักขระพิเศษหรือสัญลักษณ์บางอย่างที่ไม่สามารถพิมพ์ได้โดยตรงจากแป้นพิมพ์ นอกจากนี้ยังสามารถใช้ Character Entities เพื่อแสดงสัญลักษณ์ / อักขระพิเศษเหล่านั้นได้
ประเภทของเอนทิตีตัวละคร
เอนทิตีอักขระมีสามประเภท -
- เอนทิตีอักขระที่กำหนดไว้ล่วงหน้า
- เอนทิตีอักขระที่มีหมายเลข
- เอนทิตีตัวละครที่ตั้งชื่อ
เอนทิตีอักขระที่กำหนดไว้ล่วงหน้า
พวกเขาได้รับการแนะนำเพื่อหลีกเลี่ยงความไม่ชัดเจนในขณะที่ใช้สัญลักษณ์บางอย่าง ตัวอย่างเช่นความไม่ชัดเจนจะสังเกตได้เมื่อน้อยกว่า (< ) หรือมากกว่า ( > ) ใช้กับแท็กมุม (<>). โดยทั่วไปแล้วเอนทิตีอักขระจะใช้เพื่อคั่นแท็กใน XML ต่อไปนี้เป็นรายการของเอนทิตีอักขระที่กำหนดไว้ล่วงหน้าจากข้อกำหนด XML สิ่งเหล่านี้สามารถใช้เพื่อแสดงอักขระโดยไม่มีความคลุมเครือ
เครื่องหมายแอมเพอร์แซนด์ - &
ใบเสนอราคาเดียว - '
มากกว่า - >
น้อยกว่า - <
คำพูดคู่ - "
เอนทิตีอักขระตัวเลข
การอ้างอิงตัวเลขใช้เพื่ออ้างถึงเอนทิตีอักขระ การอ้างอิงตัวเลขอาจอยู่ในรูปแบบฐานสิบหรือฐานสิบหกก็ได้ เนื่องจากมีการอ้างอิงตัวเลขหลายพันรายการจึงยากที่จะจำ การอ้างอิงตัวเลขหมายถึงอักขระตามหมายเลขในชุดอักขระ Unicode
ไวยากรณ์ทั่วไปสำหรับการอ้างอิงตัวเลขทศนิยมคือ -
&# decimal number ;
ไวยากรณ์ทั่วไปสำหรับการอ้างอิงตัวเลขฐานสิบหกคือ -
&#x Hexadecimal number ;
ตารางต่อไปนี้แสดงรายการเอนทิตีอักขระที่กำหนดไว้ล่วงหน้าพร้อมค่าตัวเลข -
ชื่อเอนทิตี | ตัวละคร | การอ้างอิงทศนิยม | การอ้างอิงเลขฐานสิบหก |
---|---|---|---|
quot | " | & # 34; | & # x22; |
แอมป์ | & | & # 38; | & # x26; |
apos | ' | & # 39; | & # x27; |
lt | < | & # 60; | & # x3C; |
gt | > | & # 62; | & # x3E; |
ชื่อเอนทิตีตัวละคร
เนื่องจากเป็นการยากที่จะจำอักขระตัวเลขประเภทของอักขระที่ต้องการมากที่สุดคือเอนทิตีอักขระที่มีชื่อ ที่นี่แต่ละเอนทิตีจะถูกระบุด้วยชื่อ
ตัวอย่างเช่น -
'Aacute' แสดงถึง
'ugrave' หมายถึงขนาดเล็กที่