我必须解析一些提要,但元素(标签)之一是colon
<dc:creator>leemore23</dc:creator>
我如何使用它来解析它lxml
?所以我这样做了
r = requests.get('http://www.site.com/feed/')
foo = (r.content).replace("dc:creator","dc")
tree = lxml.etree.fromstring(foo)
for article_node in tree.xpath('//item'):
data['dc'] = article_node.xpath('.//dc')[0].text.strip()
但我认为有更好的方法,比如
data['dc'] = article_node.xpath('.//dc:creator')[0].text.strip()
或者
data['dc'] = article_node.xpath('.//dc|creator')[0].text.strip()
所以无需更换
你有什么建议吗?