XML - Encodage

Encodingest le processus de conversion des caractères Unicode en leur représentation binaire équivalente. Lorsque le processeur XML lit un document XML, il code le document en fonction du type de codage. Par conséquent, nous devons spécifier le type de codage dans la déclaration XML.

Types d'encodage

Il existe principalement deux types d'encodage -

  • UTF-8
  • UTF-16

UTF signifie UCS Transformation Format , et UCS lui-même signifie Universal Character Set . Le nombre 8 ou 16 fait référence au nombre de bits utilisés pour représenter un caractère. Ils sont de 8 (1 à 4 octets) ou 16 (2 ou 4 octets). Pour les documents sans informations d'encodage, UTF-8 est défini par défaut.

Syntaxe

Le type d'encodage est inclus dans la section prologue du document XML. La syntaxe du codage UTF-8 est la suivante -

<?xml version = "1.0" encoding = "UTF-8" standalone = "no" ?>

La syntaxe du codage UTF-16 est la suivante -

<?xml version = "1.0" encoding = "UTF-16" standalone = "no" ?>

Exemple

L'exemple suivant montre la déclaration d'encodage -

<?xml version = "1.0" encoding = "UTF-8" standalone = "no" ?>
<contact-info>
   <name>Tanmay Patil</name>
   <company>TutorialsPoint</company>
   <phone>(011) 123-4567</phone>
</contact-info>

Dans l'exemple ci-dessus encoding="UTF-8", spécifie que 8 bits sont utilisés pour représenter les caractères. Pour représenter des caractères 16 bits,UTF-16 l'encodage peut être utilisé.

Les fichiers XML encodés avec UTF-8 ont tendance à être plus petits que ceux encodés au format UTF-16.