我有许多呈现无效字符的网站。页面的元标记指定 UTF-8 编码。但是,许多页面包含 UTF-8 无法解释的字符,可能是因为这些文件是使用另一种编码(例如 ANSI)保存的。我现在特别关心的是一个花哨的撇号(如“鲍勃的”……抱歉,如果没有正确显示)。W3 的验证器指示实体是“ \x92 ”,但它不会验证文件,因为它没有映射到 unicode。当然,如果我在 Notepad++ 中打开文件并将编码更改为 UTF-8,则该字符将替换为黑框中的 92。
这是我的问题:解决此问题的最简单方法是什么?我是否必须打开所有页面并用传统的撇号替换该字符?或者是否有一个我可以添加(例如,到 IIS)的快速修复,它可能会覆盖或修复编码问题?还是我必须蛮力查找/替换?我在这些网站上有数百个页面,我不知道我必须更改其中的多少,所以如果有人知道我可以规避这个问题或快速修复它的方法,我将不胜感激。