`/` vs `[]`

举个例子：

<foo>
    <bar>test1</bar>
</foo>
<foo>
    test2
</foo>

[]内也可以写坐标： [1] 也就是[position() = 1]，会取得符合条件的第一个元素

轴 `::`

轴是用::分割的前缀，轴指定相对于当前节点集的任意元素，既可以是子节点，又可以是当前节点、兄弟节点或者其祖先节点

举个例子：

/foo/following-sibling:bar

从根节点开始
接着/foo：检查节点集中的每个节点（这里就一个根节点）的子节点，把所有的foo元素组成新的集合供下一步使用
接着/following-sibling::bar: 检查节点集中的每个节点的同级节点，如果存在同级节点是bar则把该节点放入新的集合(此处实际没什么作用，还是取得所有的foo节点)

实际上/foo/bar意思是/child::foo/child::bar, /foo[bar] 意思是 /child::foo[child::bar]

此外，还有一些语法糖：attribute::foo 可以写成 @foo, /descendant-or-self::foo可以写成//foo，也就是说//表示自身或者任意后代。

注意：在scrapy中使用xpath时

1
2
3

users = response.xpath("//*[id='user']")
for user in users:
    item['passwd'] = user.xpath(".//*[id='passwd']")

user.xpath(".//*[id='passwd']")必须有这个点.，否则会找出文档中所有符合条件的节点,而不是当前user下的集合

参考资料

Concise XPath
XPath 教程