我有下一个 xml:
<a>
<aa id = 1>
<data>aaaa</data>
</aa>
<aa id = 2>
<data>bbbb</data>
</aa>
<aa id = 3>
<data>cccc</data>
</aa>
</a>
我想获取数据的文本 (aaaa,bbbb...) 我该怎么做?(我一直在使用 etree.ElementTree 包)
XML 文件:
<?xml version="1.0"?>
<a>
<aa id="1">
<data>aaaa</data>
</aa>
<aa id="2">
<data>bbbb</data>
</aa>
<aa id="3">
<data>cccc</data>
</aa>
</a>
您可以使用XPath
查询:
from lxml import etree
xml = etree.parse('/tmp/a.xml')
xml.xpath('.//data/text()')
['aaaa', 'bbbb', 'cccc'] #returns that
你可以试试这个:
In [1]: import xml.etree.ElementTree as ET
In [2]: tree = ET.parse('test.xml')
In [3]: root = tree.getroot()
In [4]: for el in root:
...: print el.find('data').text
...:
...:
aaaa
bbbb
cccc
您提供的代码中唯一缺少的是elem.find('data').text
(在循环内部for
) - 这将返回您正在寻找的值。
tree = xml.parse(file)
root = tree.getroot()
listElem = root.findall("aa")
for elem in listElem:
tmp1 = elem.findall("data")
str = tmp1[0].text