XML - Phần CDATA

Trong chương này, chúng ta sẽ thảo luận về XML CDATA section. Thuật ngữ CDATA có nghĩa là Dữ liệu Ký tự. CDATA được định nghĩa là các khối văn bản không được phân tích cú pháp bởi trình phân tích cú pháp, nhưng được công nhận là đánh dấu.

Các thực thể được xác định trước như &amplt;, &ampgt;,&ampamp;yêu cầu nhập và thường khó đọc trong phần đánh dấu. Trong trường hợp đó, phần CDATA có thể được sử dụng. Bằng cách sử dụng phần CDATA, bạn đang ra lệnh cho trình phân tích cú pháp rằng phần cụ thể của tài liệu không chứa đánh dấu và phải được coi là văn bản thông thường.

Cú pháp

Sau đây là cú pháp cho phần CDATA:

<![CDATA[
   characters with markup
]]>

Cú pháp trên bao gồm ba phần:

  • CDATA Start section - CDATA bắt đầu bằng dấu phân cách chín ký tự <![CDATA[

  • CDATA End section - Phần CDATA kết thúc bằng ]]> dấu phân cách.

  • CData section- Các ký tự giữa hai thùng này được hiểu là ký tự, không phải là ký hiệu. Phần này có thể chứa các ký tự đánh dấu (<,> và &), nhưng chúng bị bộ xử lý XML bỏ qua.

Thí dụ

Mã đánh dấu sau đây cho thấy một ví dụ về CDATA. Ở đây, mỗi ký tự được viết bên trong phần CDATA bị bộ phân tích cú pháp bỏ qua.

<script>
   <![CDATA[
      <message> Welcome to TutorialsPoint </message>
   ]] >
</script >

Trong cú pháp trên, mọi thứ giữa <message> và </message> được coi là dữ liệu ký tự chứ không phải đánh dấu.

Quy tắc CDATA

Các quy tắc đã cho bắt buộc phải được tuân theo cho XML CDATA -

  • CDATA không được chứa chuỗi "]]>" ở bất kỳ đâu trong tài liệu XML.
  • Không được phép lồng trong phần CDATA.