4

我正在使用 BS4 解析 XML 文件并尝试将其写回新的 XML 文件。

输入文件:

<tag1>
  <tag2 attr1="a1"> example text </tag2>
  <tag3>
    <tag4 attr2="a2"> example text </tag4>
    <tag5>
      <tag6 attr3="a3"> example text </tag6>
    </tag5>
  </tag3>
</tag1>

脚本:

soup = BeautifulSoup(open("input.xml"), "xml")
f = open("output.xml", "w") 
f.write(soup.encode(formatter='minimal'))
f.close()

输出:

<tag1>
<tag2 attr1="a1"> example text </tag2>
<tag3>
<tag4 attr2="a2"> example text </tag4>
<tag5>
<tag6 attr3="a3"> example text </tag6>
</tag5>
</tag3>
</tag1>

我想保留输入文件的缩进。我尝试使用美化选项。

输出美化:

<tag1>
  <tag2 attr1="a1"> 
    example text 
  </tag2>
  <tag3>
    <tag4 attr2="a2"> 
      example text 
    </tag4>
    <tag5>
      <tag6 attr3="a3"> 
        example text 
      </tag6>
    </tag5>
   </tag3>
</tag1>

但这不是我想要的。我想保持输入文件中标签的精确缩进。

4

1 回答 1

2

不幸的是,您不能直接使用它。Beautiful soup 解析其输入并且不保留原始格式的痕迹。

因此,如果不修改 XML,您可以先将其作为整个字符串读取到内存中,然后将该字符串输入 BS 进行解析并进行测试,然后使用它写回新文件。

如果要修改 XML 并使用特殊格式,则必须导航 BS 树并手动对其进行格式化。

于 2015-04-23T15:33:14.513 回答