18

给定如下的 XML:

<root>
    <element>A</element>
    <element>B</element>
</root>

如何使用 ElementTree 及其对 XPath 的支持将元素与内容 A 匹配?谢谢

4

3 回答 3

36

AFAIK ElementTree 不支持 XPath。它改变了吗?

无论如何,您可以使用lxml和以下 XPath 表达式:

import lxml.etree
doc = lxml.etree.parse('t.xml')
print doc.xpath('//element[text()="A"]')[0].text
print doc.xpath('//element[text()="A"]')[0].tag

结果将是:

A
element
于 2012-05-31T15:12:55.040 回答
11

如果您想使用标准库ElementTree而不是 lxml,您可以使用迭代来查找具有特定文本值的所有子元素。例如:

import sys
import xml.etree.ElementTree as etree

s = """<root>
    <element>A</element>
    <element>B</element>
</root>"""

e = etree.fromstring(s)

if sys.version_info < (2, 7):
    found = [element for element in e.getiterator() if element.text == 'A']
else:
    found = [element for element in e.iter() if element.text == 'A']

print found[0].text # This prints 'A', honestly!

注意:您可能希望text在列表推导中对元素的值进行一些剥离。

编辑这将适用于您的 XML 树中的任何深度。例如,

s = """<root>
    <element>A</element>
    <element><sub>A</sub></element>
</root>"""

found = [element for element in e.getiterator() if element.text == 'A']

for f in found:
    print f

将打印

<Element element at 7f20a882e3f8>
<Element sub at 7f20a882e4d0>
于 2012-05-31T15:58:00.547 回答
9

您可以在 ElementTree 中使用 XPath的子集。不需要安装任何库。

config.findall('.//*[element="A"]/element')

正如@Bionicegenius 的评论所解释的那样,如果您的元素没有兄弟姐妹,上面的表达式才有效,但您明白了。

可以在 ElementTree 中使用 XPath,这是最简单的解决方案。

于 2017-11-07T23:18:26.610 回答