我正在尝试创建一个可以可视化两个 XML 之间差异的 Web 工具。difflib
在创建具有差异的 html 时工作得很好,但随后一些 unicode 文本出现在 XML 中,并且生成的 html 现在包含 html 编码的字母。
有没有其他方法可以解决这个问题?
我假设困扰您的是“html字符实体”,而不是它们的数字对应物。您可以重新映射它们,例如通过您最喜欢的支持正则表达式的 cli 工具(例如 sed)和来自unicode e-workers或参考的表格。数字实体编码可以在 html 和 xml 文件中使用。
最好的问候,卡斯滕