3

这是lxml 文档中的一个示例:

>>> regexpNS = "http://exslt.org/regular-expressions"
>>> find = etree.XPath("//*[re:test(., '^abc$', 'i')]",
...                    namespaces={'re':regexpNS})

>>> root = etree.XML("<root><a>aB</a><b>aBc</b></root>")
>>> print(find(root)[0].text)
aBc

我想将re:test()函数导入默认命名空间,这样我就可以在没有前缀的情况下调用它re:。我该怎么做?谢谢!

4

1 回答 1

5

您可以将函数放在空的函数命名空间中:

functionNS = etree.FunctionNamespace(None)
functionNS['test'] = lambda context, nodes, *args: print(context, nodes, args)

通过这样做,新test函数已经注册了空的命名空间前缀,这意味着你可以像这样使用它:

root.xpath("//*[test(., 'arg1', 'arg2')]")

不幸的是,调用的函数"{http://exslt.org/regular-expressions}test"不能从 python 中获得,只能从用 C 实现的 lxml 扩展中获得,所以你不能简单地将它分配给functionNS['test'].

这意味着您需要在 python 中重新实现它以将其分配给空函数命名空间......

如果这不值得您省去输入三个字符的麻烦,您可以使用这个技巧来使re命名空间的前缀成为全局的:

etree.FunctionNamespace("http://exslt.org/regular-expressions").prefix = 're'

那么至少你不需要为每个 xpath 表达式传递命名空间字典。

于 2013-06-25T09:33:06.770 回答