我的问题是关于如何获取存储在不允许结束标签的标签中的信息。这是相关的xml:
<?xml version="1.0" encoding="UTF-8"?>
<uws:job>
<uws:results>
<uws:result id="2014-03-03T15:42:31:1337" xlink:href="http://www.cosmosim.org/query/index/stream/table/2014-03-03T15%3A42%3A31%3A1337/format/csv" xlink:type="simple"/>
</uws:results>
</uws:job>
我希望在这里提取 xlink:href url。如您所见,uws:result 标签不需要结束标签。此外,在 python 中工作时,拥有 'uws:' 使得处理它们有点棘手。这是我到目前为止所尝试的:
from lxml import etree
root = etree.fromstring(xmlresponse.content)
url = root.find('{*}results').text
其中 xmlresponse.content 是要解析的 xml 数据。这返回的是
'\n '
这表明它只找到换行符,因为我真正想要的内容包含在结果标签内的标签中。任何想法将不胜感激。