4

我有许多脚本可以获取外部数据并更新部分 xml 文件。

我在我的 python 脚本中使用 lxml,它以十进制表示法保存字符引用,例如:

$ cat input.xml
<data>
  <record text="&#x41f;&#x440;&#x438;&#x432;&#x435;&#x442;">
  </record>
</data> 

$ python
>>> from lxml import etree
>>> tree = etree.parse("input.xml")
>>> tree.write("out.xml")

$ cat out.xml
<data>
  <record text="&#1055;&#1088;&#1080;&#1074;&#1077;&#1090;">
  </record>
</data>

而其他脚本使用十六进制形式:<record text="&#x41f;&#x440;&#x438;&#x432;&#x435;&#x442;">因此即使没有实际更改,git 也会对这些文件进行无穷无尽的更改。

如何告诉 lxml&#x41f;在 python 脚本中以十六进制形式 () 保存字符引用?

4

0 回答 0