我正在尝试解析一个大的 xml 文件。
它具有以下结构。
< merchandiser >
<header></header>
<product>
<name></name>
<URL>
<info>
</info>
<product>
</product>
</URL>
</product>
............
<product>
<name></name>
<URL>
<info>
</info>
<product>
</product>
</URL>
</product>
</merchandiser>
我正在使用 python-lxml 库中的 iter.parse() 。
for event , element in etree.iterparse(xmlfile,tag='product'):
if element.tag=="product" and event == "end":
if element.findall("..")[0].tag=='merchandiser':
print element.xpath('./URL/product/text()')
print element.xpath('./URL/info/text()')
element.clear()
该脚本打印标签内的文本,但无法打印标签内的文本。
我认为它是因为相同的标签名称。
请告诉我我做错了什么?