18

我有大量现有的 xml 文件,我正在尝试向所有这些文件中添加一个元素(它们是许多 maven 项目的 pom.xml,我正在尝试向所有这些文件中添加一个父元素)。以下是我的确切代码。

问题是 pom2.xml 中的最终 xml 输出在一行中包含完整的parent元素。虽然,当我自己打印元素时,它像往常一样用 4 行写出来。如何打印出具有正确格式的parent元素的完整 xml?

from lxml import etree

parentPom = etree.Element('parent')
groupId = etree.Element('groupId')
groupId.text = 'org.myorg'
parentPom.append(groupId)

artifactId = etree.Element('artifactId')
artifactId.text = 'myorg-master-pom'
parentPom.append(artifactId)

version = etree.Element('version')
version.text = '1.0.0'
parentPom.append(version)

print etree.tostring(parentPom, pretty_print=True)

pom = etree.parse("pom.xml")
projectElement = pom.getroot()
projectElement.insert(0, parentPom)

file = open("pom2.xml", 'wb')
file.write(etree.tostring(projectElement, pretty_print=True))
file.close()

打印输出:

<parent>
  <groupId>org.myorg</groupId>
  <artifactId>myorg-master-pom</artifactId>
  <version>1.0.0</version>
</parent>

pom2.xml 中相同元素的输出:

<parent><groupId>com.inmobi</groupId><artifactId>inmobi-master-pom</artifactId><version>1.0.1</version></parent><modelVersion>4.0.0</modelVersion>
4

1 回答 1

17

这可能会让你感兴趣。

http://lxml.de/FAQ.html#why-doesn-t-the-pretty-print-option-reformat-my-xml-output

简而言之,以供将来参考:

parser = etree.XMLParser(remove_blank_text=True)
pom = etree.parse("pom.xml",parser)
于 2012-12-03T12:18:53.490 回答