2

我正在尝试创建一个可以可视化两个 XML 之间差异的 Web 工具。difflib在创建具有差异的 html 时工作得很好,但随后一些 unicode 文本出现在 XML 中,并且生成的 html 现在包含 html 编码的字母。

有没有其他方法可以解决这个问题?

4

1 回答 1

1

我假设困扰您的是“html字符实体”,而不是它们的数字对应物。您可以重新映射它们,例如通过您最喜欢的支持正则表达式的 cli 工具(例如 sed)和来自unicode e-workers参考的表格。数字实体编码可以在 html 和 xml 文件中使用。

最好的问候,卡斯滕

于 2012-10-29T08:35:34.793 回答