10

假设我有这样的 XML:

 <graph label="Test" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:cy="http://www.cytoscape.org" xmlns="http://www.cs.rpi.edu/XGMML"  directed="1">
    <foo>...</foo>
 </graph>

第一个元素名称及其所有属性都出现在一行上。

我已经看到如何使用 lxml 漂亮地打印元素树,代码如下:

from lxml import etree
 ...
def prettyPrintXml(filePath):
    assert filePath is not None
    parser = etree.XMLParser(resolve_entities=False, remove_blank_text=True, 
                             strip_cdata=False)
    document = etree.parse(filePath, parser)
    print(etree.tostring(document, pretty_print=True, encoding='utf-8'))

...但是使用它,每个元素都出现在一行上。

是否有一个神奇的咒语告诉漂亮的打印机在元素属性之间插入换行符,例如,行长不超过 80 个字符?

我希望结果看起来像这样:

<graph label="Test"
       xmlns:dc="http://purl.org/dc/elements/1.1/"
       xmlns:xlink="http://www.w3.org/1999/xlink"
       xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
       xmlns:cy="http://www.cytoscape.org"
       xmlns="http://www.cs.rpi.edu/XGMML"  directed="1">
  <foo>...</foo>
</graph>

ps:我不想诉诸于subprocessandxmllint

4

1 回答 1

3

lxml内置了一个漂亮的打印功能:这里有一个教程,描述了几种打印 xml 的方法。但是,它有一些限制(根据 lxml,xml 规范中的限制)。

这个stackoverflow问题有几个答案,或多或少的hacky解决方案可以漂亮地打印xml,我认为您至少可以对基于正则表达式的答案进行建模以满足您的需求。

Fredrik Lundh(以ElementTree闻名)对打印 xml有一个非常底层的描述,您还可以自定义换行和缩进属性。

于 2013-03-01T10:41:01.687 回答