4

我正在使用cElementTreePython 中的模块来获取XML树的文本子节点,使用该text属性。但它似乎只适用于直接文本子项(见下文)。

$ python
...
>>> import xml.etree.cElementTree as ET
>>> root = ET.XML('<root><elm key="value">Some text</elm>More text</root>')
>>> root.text
>>> root = ET.XML('<root>Text 1<elm key="value">Text</elm>Text 2<elm2 />Text 3</root>')
>>> root.text
'Text 1'
>>>

是否可以使用该模块检索给定元素的所有直接文本子元素(可能作为列表,即['More text']['Text 1', 'Text 2', 'Text 3']上面的示例中)cElementTree

4

1 回答 1

9

使用xml.etree.ElementTree.Element.itertext

>>> import xml.etree.cElementTree as ET
>>> root = ET.XML('<root><elm key="value">Some text</elm>More text</root>')
>>> list(root.itertext())
['Some text', 'More text']
>>> root = ET.XML('<root>Text 1<elm key="value">Text</elm>Text 2<elm2 />Text 3</root>')
>>> list(root.itertext())
['Text 1', 'Text', 'Text 2', 'Text 3']

更新

要获得即时文本子节点,您还需要访问tail子节点:

>>> root = ET.XML('<root><elm key="value">Some text</elm>More text</root>')
>>> ([root.text] if root.text else []) + [child.tail for child in root]
['More text']
>>> root = ET.XML('<root>Text 1<elm key="value">Text</elm>Text 2<elm2 />Text 3</root>')
>>> ([root.text] if root.text else []) + [child.tail for child in root]
['Text 1', 'Text 2', 'Text 3']
于 2015-12-12T14:22:20.820 回答