我们的网站通过 HtmlTidy 运行用户的输入来清理它。显然,在这样做的同时,它还会通过转换变音符号给我们的国际用户带来痛苦。是否有任何选项可以指定 HtmlTidy 不这样做?
我尝试了使用所有可能选项的 CharacterEncoding,但似乎没有任何效果。
我们的网站通过 HtmlTidy 运行用户的输入来清理它。显然,在这样做的同时,它还会通过转换变音符号给我们的国际用户带来痛苦。是否有任何选项可以指定 HtmlTidy 不这样做?
我尝试了使用所有可能选项的 CharacterEncoding,但似乎没有任何效果。
只需在配置文件中提供一个输出编码(输入编码是可选的):
input-encoding: win1252
output-encoding: latin1
有关可用编码的概述,请查看输出编码文档。
编辑:所以你正在使用.NET bindings。这是完全相同的设置:
Document d = new Document(new FileStream("in.html", FileMode.Open));
d.InputCharacterEncoding = EncodingType.Utf8;
d.OutputCharacterEncoding = EncodingType.Win1252;
d.CleanAndRepair();
d.Save("out.html");
使用正确的编码设置,您将获得正确的结果,无需ü
等。