所以:我们有一个 XML 文档:
<items>
<item id="1">some text</item>
<item id="2">some <b>bold</b> text which carried onto the next line,</item>
<item id="3"> and is <b>bold, <i>italic, <u>and underlined</u></i></b>!</item>
<item id="4">some more boring text <i>with tags</i></item>
</items>
我们知道我们想要组合项目 2 和 3 的内容,所以我们有:
<item id="2_3">some <b>bold</b> ... next line,
and is <b>bold, <i>it ... </b>!</item>
处理标签内容的最干净的方法是什么,这样我们就不会丢失任何嵌套标签/尾随文本?
list(item)
或者item.getchildren()
只是给我粗体标签 - 即不是直接的项目文本。
我们可以尝试item[-1].tail
给它text
第二个项目,但这看起来非常笨拙——一定有更好的方法,对吧?