एक्सएमएल - कैरेक्टर एंटिटीज

यह अध्याय XML का वर्णन करता है Character Entities। कैरेक्टर एंटिटीज को समझने से पहले, आइए पहले समझते हैं कि XML एंटिटी क्या है।

W3 कंसोर्टियम द्वारा एक इकाई की परिभाषा इस प्रकार है -

"दस्तावेज़ इकाई इकाई ट्री की जड़ और XML प्रोसेसर के लिए एक प्रारंभिक बिंदु के रूप में कार्य करता है"।

इसका मतलब है, एक्सएमएल में इकाइयां प्लेसहोल्डर हैं। इन्हें दस्तावेज़ प्रोलॉग या डीटीडी में घोषित किया जा सकता है। विभिन्न प्रकार की संस्थाएं हैं और इस अध्याय में हम चरित्र इकाई पर चर्चा करेंगे।

दोनों, HTML और XML, उनके उपयोग के लिए कुछ प्रतीक आरक्षित हैं, जिनका उपयोग XML कोड में सामग्री के रूप में नहीं किया जा सकता है। उदाहरण के लिए,< तथा >XML टैग खोलने और बंद करने के लिए संकेतों का उपयोग किया जाता है। इन विशेष वर्णों को प्रदर्शित करने के लिए, वर्ण संस्थाओं का उपयोग किया जाता है।

कुछ विशेष अक्षर या प्रतीक हैं जो सीधे कीबोर्ड से टाइप करने के लिए उपलब्ध नहीं हैं। चरित्र प्रतीकों का उपयोग उन प्रतीकों / विशेष पात्रों को प्रदर्शित करने के लिए भी किया जा सकता है।

चरित्र संस्थाओं के प्रकार

चार प्रकार की वर्ण संस्थाएँ हैं -

  • पूर्वनिर्धारित चरित्र संस्थाएँ
  • गिने गए कैरेक्टर एंटिटीज
  • जिसका नाम कैरेक्टर एंटिटीज रखा गया

पूर्वनिर्धारित चरित्र संस्थाएँ

कुछ प्रतीकों का उपयोग करते समय अस्पष्टता से बचने के लिए उन्हें पेश किया जाता है। उदाहरण के लिए, जब कम से कम एक अस्पष्टता देखी जाती है (< ) या इससे अधिक ( > ) प्रतीक का उपयोग कोण टैग के साथ किया जाता है (<>)। वर्ण संस्थाएँ मूल रूप से XML में टैग को सीमांकित करने के लिए उपयोग की जाती हैं। निम्नलिखित एक्सएमएल विनिर्देश से पूर्व-परिभाषित चरित्र संस्थाओं की एक सूची है। इनका उपयोग बिना अस्पष्टता के पात्रों को व्यक्त करने के लिए किया जा सकता है।

  • एम्परसैंड - &amp;

  • एकल उद्धरण - &apos;

  • से अधिक - &gt;

  • से कम - &lt;

  • दोहरी बोली - &quot;

न्यूमेरिक कैरेक्टर एंटिटीज

संख्यात्मक संदर्भ का उपयोग चरित्र इकाई को संदर्भित करने के लिए किया जाता है। संख्यात्मक संदर्भ या तो दशमलव या हेक्साडेसिमल प्रारूप में हो सकता है। जैसा कि हजारों संख्यात्मक संदर्भ उपलब्ध हैं, ये याद रखना थोड़ा कठिन है। संख्यात्मक संदर्भ यूनिकोड चरित्र सेट में इसकी संख्या से चरित्र को संदर्भित करता है।

दशमलव संख्यात्मक संदर्भ के लिए सामान्य वाक्यविन्यास है -

&# decimal number ;

हेक्साडेसिमल संख्यात्मक संदर्भ के लिए सामान्य वाक्यविन्यास है -

&#x Hexadecimal number ;

निम्न तालिका उनके संख्यात्मक मानों के साथ कुछ पूर्वनिर्धारित चरित्र संस्थाओं को सूचीबद्ध करती है -

इकाई नाम चरित्र दशमलव संदर्भ हेक्साडेसिमल संदर्भ
quot " & # 34; & # X22;
एम्प और & # 38; & # X26;
apos ' & # 39; & # X27;
लेफ्टिनेंट < & # 60; & # X3C;
जीटी > & # 62; & # X3e;

जिसका नाम कैरेक्टर एंटिटी रखा गया है

जैसा कि संख्यात्मक वर्णों को याद रखना कठिन है, चरित्र इकाई का सबसे पसंदीदा प्रकार नामित चरित्र इकाई है। यहां, प्रत्येक इकाई को एक नाम से पहचाना जाता है।

उदाहरण के लिए -

  • 'एक्यूट'

    तीव्र उच्चारण के साथ पूंजी चरित्र का प्रतिनिधित्व करता है ।

  • 'बदसूरत'

    गंभीर उच्चारण के साथ छोटे का प्रतिनिधित्व करता है ।