2

我们的网站通过 HtmlTidy 运行用户的输入来清理它。显然,在这样做的同时,它还会通过转换变音符号给我们的国际用户带来痛苦。是否有任何选项可以指定 HtmlTidy 不这样做?

我尝试了使用所有可能选项的 CharacterEncoding,但似乎没有任何效果。

4

1 回答 1

1

只需在配置文件中提供一个输出编码(输入编码是可选的):

input-encoding: win1252
output-encoding: latin1

有关可用编码的概述,请查看输出编码文档

编辑:所以你正在使用.NET bindings。这是完全相同的设置:

Document d = new Document(new FileStream("in.html", FileMode.Open));

d.InputCharacterEncoding = EncodingType.Utf8;
d.OutputCharacterEncoding = EncodingType.Win1252;
d.CleanAndRepair();

d.Save("out.html");

使用正确的编码设置,您将获得正确的结果,无需ü等。

于 2010-03-15T21:19:38.270 回答