1

所以:我们有一个 XML 文档:

<items>
  <item id="1">some text</item>
  <item id="2">some <b>bold</b> text which carried onto the next line,</item>
  <item id="3"> and is <b>bold, <i>italic, <u>and underlined</u></i></b>!</item>
  <item id="4">some more boring text <i>with tags</i></item>
</items>

我们知道我们想要组合项目 2 和 3 的内容,所以我们有:

<item id="2_3">some <b>bold</b> ... next line,
 and is <b>bold, <i>it ... </b>!</item>

处理标签内容的最干净的方法是什么,这样我们就不会丢失任何嵌套标签/尾随文本?

list(item)或者item.getchildren()只是给我粗体标签 - 即不是直接的项目文本。

我们可以尝试item[-1].tail给它text第二个项目,但这看起来非常笨拙——一定有更好的方法,对吧?

4

0 回答 0