1

我有一个 xml 文件,我正在其中查找特定标签(例如: tag <x>),如果找到他,我会将其值替换/更新为特定文本(例如:test)。

Python 版本 3.5.0。

示例 xml 文件:

<root>
 <a/>
 <b>0</b>
 <c/>
 <x>some value</x>
</root>

这是我的代码:

from xml.etree import ElementTree as et

datafile = 'input.xml'     # path to the source xml file
datafile_out = 'output.xml'    # path to the updated xml
tree = et.parse(datafile)
tree.find('.//x').text ='TEST'  # find <x> tag and write there value "TEST"
tree.write(datafile_out)    #generating updated xml file

这是我的输出:

<root>
 <a />
 <b>0</b>
 <c />
 <x>TEST</x>
</root>

一切都按预期工作。

但我的问题是空标签中有额外的空间:<a /> 在标签名称“a”“斜杠”之间,输入 xml 文件中不存在。

我正在处理带有很多空标签的相当大的 xml 文件,所以每个额外的空间都会使这些文件变得更大。

有没有办法阻止ElementTree.write()添加额外的空间?

注意:我想在 Python 模块中使用构建,而不是安装第三方解决方案。

非常感谢您的建议!

4

1 回答 1

2

您是否尝试过使用正则表达式。

举个例子:

yourXmlAsString.replaceAll(">\s*<", "><"); 将删除每个 XML 元素之间的所有空格。

于 2015-10-24T18:49:41.413 回答