XPath基础笔记

yidao620c

浏览: 531595 次
性别:
来自: 广州

最近访客更多访客>>

kelly_zsl

Eywa

qq849397558

xjun15

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

JavaEE

XPath

Wiki 写道

XPath即为XML路径语言（XML Path Language），它是一种用来确定XML文档中某部分位置的语言。

XPath基于XML的树状结构，提供在数据结构树中找寻节点的能力。起初XPath的提出的初衷是将其作为一个通用的、介于XPointer与XSL间的语法模型。但是XPath很快的被开发者采用来当作小型查询语言。

W3C网址： http://www.w3schools.com/XPath/

表示法

最常见的XPath表达式是路径表达式（XPath这一名称的另一来源）。路径表达式是从一个XML节点（当前的上下文节点）到另一个节点、或一组节点的书面步骤顺序。这些步骤以“／”字符分开，每一步有三个构成成分：

轴描述

节点测试（用于筛选节点位置和名称）

节点描述（用于筛选节点的属性和子节点特征）

一般情况下，我们使用简写后的语法。虽然完整的轴描述是一种更加贴近人类语言，利用自然语言的单词和语法来书写的描述方式，但是相比之下也更加罗嗦。

表示法三种

最简单的XPath如下：

/A/B/C

在这里选择所有符合规矩的C节点：C节点必须是B的子节点（B/C），同时B节点必须是A的子节点（A/B），而A是这个XML文档的根节点（/A）。此时的这种描述法类似于磁盘中文件的路径（URI），从盘符开始顺着一级一级的目录最终找到文件。

这里还有一个复杂一些的例子，包含了全部构成成分（请详细的看）：

A//B/*[1]

此时选择的元素是：在B节点下的第一个节点（B/*[1]），不论节点的名称如何（*）；而B节点必须出现在A节点内，不论和A节点之间相隔几层节点（//B）；与此同时A节点还必须是当前节点的子节点（A，前边没有/）。

最后一个常用的例子，在所有节点下查找：

//A/B/C/*[2]

轴语法

在未缩写语法里，两个上述范例可以写为：

/child::A/child::B/child::C

child::A/descendant-or-self::B/child::node()[1]

在XPath的每个步骤里，通过完整的轴描述（例如：child或descendant-or-self）进行明确的指定，然后使用::，它的后面跟着节点测试的内容，例如上面范例所示的A以及node()。

XPath 轴

轴可定义相对于当前节点的节点集。

轴名称结果

ancestor	选取当前节点的所有先辈（父、祖父等）。
ancestor-or-self	选取当前节点的所有先辈（父、祖父等）以及当前节点本身。
attribute	选取当前节点的所有属性。
child	选取当前节点的所有子元素。
descendant	选取当前节点的所有后代元素（子、孙等）。
descendant-or-self	选取当前节点的所有后代元素（子、孙等）以及当前节点本身。
following	选取文档中当前节点的结束标签之后的所有节点。
namespace	选取当前节点的所有命名空间节点。
parent	选取当前节点的父节点。
preceding	选取文档中当前节点的开始标签之前的所有节点。
preceding-sibling	选取当前节点之前的所有同级节点。
self	选取当前节点。

实例

例子结果

child::book	选取所有属于当前节点的子元素的 book 节点。
attribute::lang	选取当前节点的 lang 属性。
child::*	选取当前节点的所有子元素。
attribute::*	选取当前节点的所有属性。
child::text()	选取当前节点的所有文本子节点。
child::node()	选取当前节点的所有子节点。
descendant::book	选取当前节点的所有 book 后代。
ancestor::book	选择当前节点的所有 book 先辈。
ancestor-or-self::book	选取当前节点的所有 book 先辈以及当前节点（如果此节点是 book 节点）
child::*/child::price	选取当前节点的所有 price 孙节点。

XPath 运算符

下面列出了可用在 XPath 表达式中的运算符：

运算符描述实例返回值

\|	计算两个节点集	//book \| //cd	返回所有拥有 book 和 cd 元素的节点集
+	加法	6 + 4	10
-	减法	6 - 4	2
*	乘法	6 * 4	24
div	除法	8 div 4	2
=	等于	price=9.80	如果 price 是 9.80，则返回 true。如果 price 是 9.90，则返回 false。
!=	不等于	price!=9.80	如果 price 是 9.90，则返回 true。如果 price 是 9.80，则返回 false。
<	小于	price<9.80	如果 price 是 9.00，则返回 true。如果 price 是 9.90，则返回 false。
<=	小于或等于	price<=9.80	如果 price 是 9.00，则返回 true。如果 price 是 9.90，则返回 false。
>	大于	price>9.80	如果 price 是 9.90，则返回 true。如果 price 是 9.80，则返回 false。
>=	大于或等于	price>=9.80	如果 price 是 9.90，则返回 true。如果 price 是 9.70，则返回 false。
or	或	price=9.80 or price=9.70	如果 price 是 9.80，则返回 true。如果 price 是 9.50，则返回 false。
and	与	price>9.00 and price<9.90	如果 price 是 9.80，则返回 true。如果 price 是 8.50，则返回 false。

Xpath函数

有关数值的函数

名称说明

fn:number(arg)	返回参数的数值。参数可以是布尔值、字符串或节点集。例子：number('100') 结果：100
fn:abs(num)	返回参数的绝对值。例子：abs(3.14) 结果：3.14 例子：abs(-3.14) 结果：3.14
fn:ceiling(num)	返回大于 num 参数的最小整数。例子：ceiling(3.14) 结果：4
fn:floor(num)	返回不大于 num 参数的最大整数。例子：floor(3.14) 结果：3
fn:round(num)	把 num 参数舍入为最接近的整数。例子：round(3.14) 结果：3

有关字符串的函数

名称说明

fn:string(arg)	返回参数的字符串值。参数可以是数字、逻辑值或节点集。例子：string(314) 结果："314"
fn:compare(comp1,comp2) fn:compare(comp1,comp2,collation)	如果 comp1 小于 comp2，则返回 -1。如果 comp1 等于 comp2，则返回 0。如果 comp1 大于 comp2，则返回 1。（根据所用的对照规则）。例子：compare('ghi', 'ghi') 结果：0
fn:concat(string,string,...)	返回字符串的拼接。例子：concat('XPath ','is ','FUN!') 结果：'XPath is FUN!'
fn:substring(string,start,len) fn:substring(string,start)	返回从 start 位置开始的指定长度的子字符串。第一个字符的下标是 1。如果省略 len 参数，则返回从位置 start 到字符串末尾的子字符串。例子：substring('Beatles',1,4) 结果：'Beat' 例子：substring('Beatles',2) 结果：'eatles'
fn:string-length(string) fn:string-length()	返回指定字符串的长度。如果没有 string 参数，则返回当前节点的字符串值的长度。例子：string-length('Beatles') 结果：7
fn:normalize-space(string) fn:normalize-space()	删除指定字符串的开头和结尾的空白，并把内部的所有空白序列替换为一个，然后返回结果。如果没有 string 参数，则处理当前节点。例子：normalize-space(' The XML ') 结果：'The XML'
fn:upper-case(string)	把 string 参数转换为大写。例子：upper-case('The XML') 结果：'THE XML'
fn:lower-case(string)	把 string 参数转换为小写。例子：lower-case('The XML') 结果：'the xml'
fn:contains(string1,string2)	如果 string1 包含 string2，则返回 true，否则返回 false。例子：contains('XML','XM') 结果：true
fn:starts-with(string1,string2)	如果 string1 以 string2 开始，则返回 true，否则返回 false。例子：starts-with('XML','X') 结果：true
fn:ends-with(string1,string2)	如果 string1 以 string2 结尾，则返回 true，否则返回 false。例子：ends-with('XML','X') 结果：false
fn:substring-before(string1,string2)	返回 string2 在 string1 中出现之前的子字符串。例子：substring-before('12/10','/') 结果：'12'
fn:substring-after(string1,string2)	返回 string2 在 string1 中出现之后的子字符串。例子：substring-after('12/10','/') 结果：'10'
fn:matches(string,pattern)	如果 string 参数匹配指定的模式，则返回 true，否则返回 false。例子：matches("Merano", "ran") 结果：true

更多函数请参考： http://www.w3school.com.cn/xpath/xpath_functions.asp

最后是我自己实际工作中使用过的XPath实例：

* //span[text()="webapps/"]/../.././span

* //bookstore/book[last()]

* /DocText/WithQuads/Page/Word[text()='July' and Quad/P1/@X > 90]

* record[field[@id='220' and @value='Red'] and field[@id='221' and @value='Large']]

* /Root//Person[contains(Blog,'cn') and contains(@ID,'01')]

* //tr[td[1][text()="hello"] and td[2][contains(text(), "512M")]]

* //td[text()="short_open_tag"]/following-sibling::td[1]

* //td[text()="short_open_tag"]/preceding-sibling::td[1]

* //td[starts-with(text(), "%s") and contains(text(), "disk:%sMB")]/following-sibling::td[2][contains(text(), "%s")]

* //a[text()='x222']/../following-sibling::td[8]/a[2]

看完前面部分，这些的含义应该很容易可以看懂了。恭喜你，基本的XPath已经没问题了！

本人博客已搬家，新地址为：http://www.pycoding.com/

分享到：

Lambdas & Streams in Java8 | Yaml基础笔记

2014-04-30 15:16
浏览 984
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论