我正在尝试解析 XML 文档。该文档具有嵌入的 HTML 格式,例如
<p>This is a paragraph
<em>with some <b>extra</b> formatting</em>
scattered throughout.
</p>
到目前为止我已经使用
import xml.etree.cElementTree as xmlTree
处理 XML 文档,但我不确定这是否提供了我正在寻找的功能。我将如何处理这里的文本节点?
另外,有没有办法在文档中找到结束标签?
谢谢!