XML - символьные сущности
В этой главе описывается XML Character Entities. Прежде чем мы разберемся с сущностями символов, давайте сначала поймем, что такое сущность XML.
По словам Консорциума W3, определение организации выглядит следующим образом:
«Сущность документа служит корнем дерева сущностей и отправной точкой для процессора XML».
Это означает, что сущности являются заполнителями в XML. Они могут быть объявлены в прологе документа или в DTD. Существуют разные типы сущностей, и в этой главе мы обсудим сущность персонажа.
Оба, HTML и XML, имеют некоторые символы, зарезервированные для их использования, которые не могут использоваться в качестве содержимого в коде XML. Например,< и >знаки используются для открытия и закрытия тегов XML. Для отображения этих специальных символов используются символьные сущности.
Есть несколько специальных символов или символов, которые нельзя ввести непосредственно с клавиатуры. Символьные сущности также могут использоваться для отображения этих символов / специальных символов.
Типы персонажей
Есть три типа персонажей:
- Предопределенные сущности символов
- Пронумерованные сущности символов
- Именованные сущности персонажей
Предопределенные сущности символов
Они введены, чтобы избежать двусмысленности при использовании некоторых символов. Например, неоднозначность наблюдается, когда меньше (< ) или больше ( > ) используется с тегом угла (<>). Сущности символов в основном используются для разграничения тегов в XML. Ниже приводится список предварительно определенных символьных сущностей из спецификации XML. Их можно использовать для однозначного обозначения символов.
Амперсанд - &
Одиночная кавычка - '
Больше чем - >
Менее чем - <
Двойная кавычка - "
Числовые символы
Цифровая ссылка используется для ссылки на символьный объект. Цифровая ссылка может быть в десятичном или шестнадцатеричном формате. Поскольку доступны тысячи числовых ссылок, их сложно запомнить. Цифровая ссылка относится к символу по его номеру в наборе символов Unicode.
Общий синтаксис для десятичной числовой ссылки -
&# decimal number ;
Общий синтаксис для шестнадцатеричной числовой ссылки -
&#x Hexadecimal number ;
В следующей таблице перечислены некоторые предопределенные символьные сущности с их числовыми значениями.
Имя сущности | символ | Десятичная ссылка | Шестнадцатеричная ссылка |
---|---|---|---|
quot | " | & # 34; | & # x22; |
усилитель | & | & # 38; | & # x26; |
апос | ' | & # 39; | & # x27; |
lt | < | & # 60; | & # x3C; |
gt | > | & # 62; | & # x3E; |
Именованный персонаж
Поскольку сложно запомнить числовые символы, наиболее предпочтительным типом символьной сущности является именованная символьная сущность. Здесь каждая сущность обозначена именем.
Например -
«Aacute» - заглавный
«уграве» представляет собой маленькое