XML-構文

この章では、XMLドキュメントを作成するための簡単な構文規則について説明します。以下は完全なXMLドキュメントです-

<?xml version = "1.0"?>
<contact-info>
   <name>Tanmay Patil</name>
   <company>TutorialsPoint</company>
   <phone>(011) 123-4567</phone>
</contact-info>

上記の例には2種類の情報があることがわかります-

  • <contact-info>のようなマークアップ

  • テキスト、または文字データ、Tutorials Pointおよび(040)123-4567

次の図は、XMLドキュメントにさまざまなタイプのマークアップとテキストを書き込むための構文規則を示しています。

上の図の各コンポーネントを詳しく見てみましょう。

XML宣言

XMLドキュメントには、オプションでXML宣言を含めることができます。次のように書かれています−

<?xml version = "1.0" encoding = "UTF-8"?>

ここで、versionはXMLバージョンであり、encodingはドキュメントで使用される文字エンコード指定します。

XML宣言の構文規則

  • XML宣言では大文字と小文字が区別され、「」で始まる必要があります。<?xml>" どこ "xml「」は小文字で書かれています。

  • ドキュメントにXML宣言が含まれている場合、それは厳密にXMLドキュメントの最初のステートメントである必要があります。

  • XML宣言は、厳密にはXMLドキュメントの最初のステートメントである必要があります。

  • HTTPプロトコルは、XML宣言に入力したエンコーディングの値をオーバーライドできます。

タグと要素

XMLファイルは、XMLノードまたはXMLタグとも呼ばれるいくつかのXML要素で構成されています。XML要素の名前は、以下に示すように三角括弧<>で囲まれています。

<element>

タグと要素の構文規則

Element Syntax −各XML要素は、以下に示すように、開始要素または終了要素のいずれかで閉じる必要があります。

<element>....</element>

または単純なケースでは、このように-

<element/>

Nesting of Elements− XML要素には、その子として複数のXML要素を含めることができますが、子要素は重複してはなりません。つまり、要素の終了タグは、最新の一致しない開始タグと同じ名前である必要があります。

次の例は、ネストされたタグが正しくないことを示しています-

<?xml version = "1.0"?>
<contact-info>
<company>TutorialsPoint
</contact-info>
</company>

次の例は、正しいネストされたタグを示しています-

<?xml version = "1.0"?>
<contact-info>
   <company>TutorialsPoint</company>
<contact-info>

Root Element−XMLドキュメントはルート要素を1つだけ持つことができます。たとえば、以下は正しいXMLドキュメントではありません。x そして y 要素はルート要素なしでトップレベルで発生します-

<x>...</x>
<y>...</y>

次の例は、正しく形成されたXMLドキュメントを示しています-

<root>
   <x>...</x>
   <y>...</y>
</root>

Case Sensitivity−XML要素の名前では大文字と小文字が区別されます。つまり、開始要素と終了要素の名前はまったく同じ場合である必要があります。

例えば、 <contact-info> とは異なります <Contact-Info>

XML属性

アン attribute名前と値のペアを使用して、要素の単一のプロパティを指定します。XML要素は1つ以上の属性を持つことができます。例-

<a href = "http://www.tutorialspoint.com/">Tutorialspoint!</a>

ここに href 属性名であり、 http://www.tutorialspoint.com/ 属性値です。

XML属性の構文規則

  • XMLの属性名(HTMLとは異なり)では大文字と小文字が区別されます。つまり、HREFhrefは2つの異なるXML属性と見なされます。

  • 同じ属性に構文内の2つの値を含めることはできません。次の例は、属性bが2回指定されているため、誤った構文を示しています。

<a b = "x" c = "y" b = "z">....</a>
  • 属性名は引用符なしで定義されますが、属性値は常に引用符で囲む必要があります。次の例は、誤ったxml構文を示しています

<a b = x>....</a>

上記の構文では、属性値は引用符で定義されていません。

XMLリファレンス

参照を使用すると、通常、XMLドキュメントに追加のテキストまたはマークアップを追加または含めることができます。参照は常に記号で始まります"&" これは予約文字であり、記号で終わります ";". XMLには2種類の参照があります-

  • Entity References−エンティティ参照には、開始区切り文字と終了区切り文字の間の名前が含まれています。例えば&amp;ここで、amp名前です。この名前は、事前定義されたテキストやマークアップの文字列を指します。

  • Character References −これらには次のような参照が含まれています &#65;、ハッシュマーク(「#」)とそれに続く数字が含まれます。数字は常に文字のUnicodeコードを参照します。この場合、65はアルファベット「A」を指します。

XMLテキスト

XML要素とXML属性の名前では大文字と小文字が区別されます。つまり、開始要素と終了要素の名前は同じ大文字と小文字で記述する必要があります。文字エンコードの問題を回避するには、すべてのXMLファイルをUnicodeUTF-8またはUTF-16ファイルとして保存する必要があります。

XML要素間およびXML属性間の空白、タブ、改行などの空白文字は無視されます。

一部の文字は、XML構文自体によって予約されています。したがって、直接使用することはできません。それらを使用するために、以下にリストされているいくつかの置換エンティティが使用されます-

許可されていない文字 代替エンティティ キャラクターの説明
< &lt; 未満
>> &gt; より大きい
&amp; アンパサンド
' &apos; アポストロフィ
「」 &quot; クォーテーションマーク