如何从使用 etree xpath 选择的节点中获取所有内部 html:
>>> from lxml import etree
>>> from StringIO import StringIO
>>> doc = '<foo><bar><div>привет привет</div></bar></foo>'
>>> hparser = etree.HTMLParser()
>>> htree = etree.parse(StringIO(doc), hparser)
>>> foo_element = htree.xpath("//foo")
我现在如何将所有 foo_element 的内部 HTML 打印为文本?我需要得到这个:
<bar><div>привет привет</div></bar>
顺便说一句,当我尝试使用时,lxml.html.tostring
我得到了奇怪的输出:
>>> import lxml.etree
>>> lxml.html.tostring(foo_element[0])
'<foo><bar><div>привет првиет</div></bar></foo>'