CDATA是什么,如何在XML中嵌入不需要解析的文本块?

CDATA是XML中用于包裹不被解析的纯文本的标记,以结尾,中间内容原样保留;不可嵌套,不能含XML声明或注释;适用于嵌入HTML、代码等场景,属性值中不可用。

CDATA 是 XML 中用于包裹一段“不被解析”的纯文本内容的特殊标记,它的作用是告诉 XML 解析器:这段内容里的所有字符(包括 &" 等)都**不要当作 XML 语法处理**,直接当作文本原样保留。

CDATA 的基本写法

CDATA 区块必须用固定格式声明:

  • 开头(注意:左方括号前是感叹号,且中间**不能有空格**)
  • ]]> 结尾(两个右方括号后紧跟一个大于号,中间也不能有空格或换行)
  • 中间的内容完全自由,可以包含任意字符,包括未转义的  、双引号等

例如:

加粗 的例子,还有 ,都不用转义!]]>

CDATA 的使用限制

虽然方便,但要注意几个硬性约束:

  • CDATA 区块**不能嵌套**——即内部不能再出现 ,否则解析会提前终止
  • 结尾标记 ]]> 是严格关键字,如果原文中真要输出这串字符,必须拆开写(比如写成 ]]>]]> 可改写为 ]]> 或用字符串拼接方式绕过)
  • XML 声明、DOCTYPE、注释、处理指令等**不能出现在 CDATA 内部**,它们只在外部起作用

什么时候该用 CDATA?

典型适用场景包括:

  • 嵌入 HTML 片段(如富文本描述字段)
  • 存放代码示例(JavaScript、XML、SQL 等含大量尖括号和符号的内容)
  • 避免对大量特殊字符逐个进行实体编码(如把 写成 zuojiankuohaophpcn
  • 与某些旧系统交互时,对方要求原始格式不被破坏

替代方案:什么时候不该用 CDATA?

如果只是个别字符需要保护,用实体编码更轻量、更兼容:

  • zuojiankuohaophpcn 替代
  • & 替代 &
  • " 替代 "

尤其在属性值中,CDATA 不可用(属性值只能用引号包裹 + 实体编码),所以别试图在 这样写——这是非法的。

基本上就这些。用对地方,CDATA 能省不少转义功夫;用错位置,反而会让 XML 失效或被截断。