考虑以下代码段:
import lxml.html
html = '<div><br />Hello text</div>'
doc = lxml.html.fromstring(html)
text = doc.xpath('//text()')[0]
print lxml.html.tostring(text.getparent())
#prints <br>Hello text
我期待看到'<div><br />Hello text</div>'
,因为br
不能有嵌套文本并且是“自我封闭的”(我的意思是/>
)。如何lxml
正确处理?