XML 语法规则
-
定义和使用
XML 的语法规则非常简单,逻辑性强;这些规则很容易学习,也很容易使用。XML 文档必须包含一个根元素,该元素是所有其他元素的父元素:<root> <child> <subchild>.....</subchild> </child> </root>
在本例中<note>是根元素:<?xml version="1.0" encoding="UTF-8"?> <note> <to>Tove</to> <from>Jani</from> <heading>Reminder</heading> <body>这个周末别忘了我!</body> </note>
-
XML Prolog
这一行称为 XML prolog:<?xml version="1.0" encoding="UTF-8"?>
XML prolog 是可选的。如果它存在,它必须在文档中位于第一位。XML 文档可以包含国际字符,如挪威语或法语。为了避免错误,应该指定使用的编码,或者将 XML 文件保存为 UTF-8。UTF-8 是 XML 文档的默认字符编码。字符编码可以在我们的字符集教程中学习。UTF-8 也是 HTML5、CSS、JavaScript、PHP和SQL的默认编码。
-
XML元素必须要有结束标记
在 XML 中,省略结束标记是非法的;所有元素都必须有结束标记:<p>这个一段落</p> <br />
注意:XML prolog 没有结束标记!这不是错误。prolog 不是 XML 文档的一部分。
XML 标记区分大小写。标签<Letter>与标签<letter>不同。打开和关闭标签必须用统一书写:<message>这个一消息</message>
在HTML中,您可能会看到嵌套不正确的元素:<b><i>此文本为粗体和斜体</b></i>
在 XML 中,所有元素必须正确嵌套在彼此之间:<b><i>此文本为粗体和斜体</i></b>
在上面的例子中,“正确嵌套”仅仅意味着由于<i>元素在<b>元素中打开,它必须在<b>元素中关闭。 -
引用XML属性值
XML 元素在名称/值对中可以有属性,就像在 HTML 中一样。在 XML 中,必须始终引用属性值:<note date="10/04/2020"> <to>Tove</to> <from>Jani</from> </note>
-
引用XML属性值
有些字符在 XML 中有特殊的含义。如果在 XML 元素中放置类似“<”的字符,它将生成错误,因为解析器将其解释为新元素的开始。这将生成一个 XML 错误:<message>salary < 1000</message>
若要避免此错误,请将“<”字符替换为实体引用:<message>salary < 1000</message>
XML 中有5个预定义的HTML实体引用:< < 小于 > > 大于 & & 与号 ' ' 撇号 " " 引号 在 XML 中,只有<和&是严格非法的,但是用>替换>也是一个好习惯。
-
XML注释
用 XML 编写注释的语法与 HTML 类似:<!-- 这是一个注释 -->
注释中间不允许有两个破折号:<!-- 这是一个无效的 -- 注释 -->
-
空白以XML格式保留
XML 不截断多个空格(HTML将多个空格截断为一个空格):XML: Hello Tove HTML: Hello Tove -
XML将新行存储为LF
- Windows 应用程序将新行存储为:回车和换行(CR+LF)。
- Unix 和 MacOSX 使用 LF。
- 旧的 Mac 系统使用 CR。
- XML 将新行存储为 LF。
符合上述语法规则的 XML 文档称为 “格式良好” 的 XML 文档。