एक्सएमएल - सिंटेक्स

इस अध्याय में, हम एक्सएमएल दस्तावेज़ लिखने के लिए सरल वाक्यविन्यास नियमों पर चर्चा करेंगे। निम्नलिखित एक पूर्ण XML दस्तावेज़ है -

<?xml version = "1.0"?>
<contact-info>
   <name>Tanmay Patil</name>
   <company>TutorialsPoint</company>
   <phone>(011) 123-4567</phone>
</contact-info>

आप उपरोक्त उदाहरण में दो प्रकार की जानकारी देख सकते हैं -

  • मार्कअप, जैसे <संपर्क-जानकारी>

  • पाठ, या चरित्र डेटा, ट्यूटोरियल प्वाइंट और (040) 123-4567

निम्न आरेख एक XML दस्तावेज़ में विभिन्न प्रकार के मार्कअप और पाठ लिखने के लिए सिंटैक्स नियमों को दर्शाता है।

आइए उपरोक्त आरेख के प्रत्येक घटक को विस्तार से देखें।

एक्सएमएल घोषणा

XML दस्तावेज़ वैकल्पिक रूप से एक XML घोषणा हो सकती है। इसे इस प्रकार लिखा गया है -

<?xml version = "1.0" encoding = "UTF-8"?>

जहाँ संस्करण XML संस्करण है और एन्कोडिंग दस्तावेज़ में प्रयुक्त वर्ण एन्कोडिंग को निर्दिष्ट करता है।

XML घोषणा के लिए सिंटैक्स नियम

  • XML घोषणा संवेदनशील है और इसके साथ शुरू होना चाहिए "<?xml>" कहाँ पे "xml"निचले-मामले में लिखा गया है।

  • यदि दस्तावेज़ में एक्सएमएल घोषणा शामिल है, तो इसे सख्ती से एक्सएमएल दस्तावेज़ का पहला बयान होना चाहिए।

  • एक्सएमएल घोषणा को कड़ाई से एक्सएमएल दस्तावेज़ में पहला बयान होना चाहिए।

  • एक HTTP प्रोटोकॉल XML घोषणा में आपके द्वारा एन्कोडिंग के मूल्य को ओवरराइड कर सकता है ।

टैग और तत्व

एक XML फ़ाइल को कई XML-तत्वों द्वारा संरचित किया जाता है, जिसे XML- नोड या XML- टैग भी कहा जाता है। XML- तत्वों के नाम त्रिकोणीय कोष्ठक में संलग्न हैं <> जैसा कि नीचे दिखाया गया है -

<element>

टैग और तत्वों के लिए सिंटैक्स नियम

Element Syntax प्रत्येक एक्सएमएल-तत्व को शुरुआत के साथ या अंत तत्वों के साथ बंद करने की आवश्यकता है -

<element>....</element>

या साधारण मामलों में, बस इस तरह से -

<element/>

Nesting of Elements- एक XML-तत्व में कई XML-तत्व हो सकते हैं जैसे कि इसके बच्चे, लेकिन बच्चों के तत्व ओवरलैप नहीं होने चाहिए। अर्थात, किसी तत्व के अंतिम टैग में वही नाम होना चाहिए जो सबसे हाल ही में शुरू किए गए टैग से जुड़ा हो।

निम्नलिखित उदाहरण गलत नेस्टेड टैग दिखाता है -

<?xml version = "1.0"?>
<contact-info>
<company>TutorialsPoint
</contact-info>
</company>

निम्नलिखित उदाहरण सही नेस्टेड टैग दिखाता है -

<?xml version = "1.0"?>
<contact-info>
   <company>TutorialsPoint</company>
<contact-info>

Root Element- एक XML दस्तावेज़ में केवल एक मूल तत्व हो सकता है। उदाहरण के लिए, निम्न XML दस्तावेज़ सही नहीं है, क्योंकि दोनोंx तथा y तत्व जड़ तत्व के बिना शीर्ष स्तर पर होते हैं -

<x>...</x>
<y>...</y>

निम्नलिखित उदाहरण एक सही ढंग से गठित XML दस्तावेज़ दिखाता है -

<root>
   <x>...</x>
   <y>...</y>
</root>

Case Sensitivity- एक्सएमएल-तत्वों के नाम केस-संवेदी हैं। इसका मतलब है कि शुरुआत और अंतिम तत्वों का नाम एक ही मामले में ठीक होना चाहिए।

उदाहरण के लिए, <contact-info> से अलग है <Contact-Info>

XML विशेषताएँ

एक attributeनाम / मान युग्म का उपयोग करते हुए तत्व के लिए एक एकल गुण निर्दिष्ट करता है। एक XML- तत्व में एक या अधिक गुण हो सकते हैं। उदाहरण के लिए -

<a href = "http://www.tutorialspoint.com/">Tutorialspoint!</a>

यहाँ href विशेषता नाम है और http://www.tutorialspoint.com/ विशेषता मान है।

XML विशेषताओं के लिए सिंटैक्स नियम

  • XML (HTML के विपरीत) में नाम दर्ज करना संवेदनशील है। यही है, HREF और href को दो अलग-अलग XML विशेषताएँ माना जाता है।

  • सिंटैक्स में समान विशेषता के दो मान नहीं हो सकते। निम्न उदाहरण गलत सिंटैक्स दिखाता है क्योंकि विशेषता b दो बार निर्दिष्ट किया गया है

    -
<a b = "x" c = "y" b = "z">....</a>
  • गुण नामों को उद्धरण चिह्नों के बिना परिभाषित किया जाता है, जबकि विशेषता मान हमेशा उद्धरण चिह्नों में दिखाई देते हैं। निम्न उदाहरण गलत xml सिंटैक्स प्रदर्शित करता है

    -
<a b = x>....</a>

उपरोक्त सिंटैक्स में, उद्धरण चिह्नों में विशेषता मान को परिभाषित नहीं किया गया है।

XML संदर्भ

संदर्भ आमतौर पर आपको XML दस्तावेज़ में अतिरिक्त पाठ या मार्कअप को जोड़ने या शामिल करने की अनुमति देते हैं। संदर्भ हमेशा प्रतीक से शुरू होते हैं"&" जो एक आरक्षित वर्ण है और प्रतीक के साथ समाप्त होता है ";". XML के दो प्रकार के संदर्भ हैं -

  • Entity References- एक इकाई संदर्भ में प्रारंभ और अंत के बीच का नाम होता है। उदाहरण के लिए&amp;जहां amp है नामनाम पाठ और / या मार्कअप की एक पूर्वनिर्धारित स्ट्रिंग को दर्शाता है।

  • Character References - इनमें संदर्भ होते हैं, जैसे कि &#65;, एक संख्या के बाद एक हैश मार्क ("#") शामिल है। संख्या हमेशा एक चरित्र के यूनिकोड कोड को संदर्भित करती है। इस मामले में, 65 वर्णमाला "ए" को संदर्भित करता है।

XML पाठ

एक्सएमएल-एलिमेंट्स और एक्सएमएल-एट्रिब्यूट्स के नाम केस-सेंसिटिव हैं, जिसका मतलब है कि स्टार्ट और एंड एलिमेंट्स का नाम एक ही मामले में लिखा जाना चाहिए। चरित्र एन्कोडिंग समस्याओं से बचने के लिए, सभी XML फ़ाइलों को यूनिकोड UTF-8 या UTF-16 फ़ाइलों के रूप में सहेजा जाना चाहिए।

XML- एलिमेंट्स और XML- एट्रिब्यूट्स के बीच ब्लैंक, टैब और लाइन-ब्रेक जैसे व्हाट्सएप कैरेक्टर को नजरअंदाज किया जाएगा।

कुछ वर्ण XML सिंटैक्स द्वारा ही आरक्षित हैं। इसलिए, उन्हें सीधे इस्तेमाल नहीं किया जा सकता है। उनका उपयोग करने के लिए, कुछ प्रतिस्थापन-संस्थाओं का उपयोग किया जाता है, जो नीचे सूचीबद्ध हैं -

अनुमति नहीं चरित्र प्रतिस्थापन इकाई चरित्र विवरण, चारित्रिक व्यौरा, वर्णन, व्याख्या
< & LT; से कम
> & Gt; से अधिक
और & Amp; एम्परसेंड
' सका apostrophe
" & Quot; उद्धरण चिन्ह