1

我正在构建一个加载其他网页的 ASP.NET Web 服务,然后将其交给客户端。我在字符代码处理方面做得很好,从 HTML 中读取元标记,然后使用该代码集来读取文件。但是,一些受教育程度较低的用户就是不理解代码集。他们声明了一种特定的编码方法,例如“gb2312”,但实际上,他只是使用普通的UTF8。当我使用 gb2312 解码文本时,一切都变得一团糟。如何检测文本是否正确解码?我将该页面加载到我的 IE 中,它正确使用 UTF-8 来解码页面。它是如何做到这一点的?

4

1 回答 1

0

根据 BOM,您可以知道使用了什么编码。

BOM 和编码

BOM 和编码

如果要检测字符集,可以使用 Mozilla 字符集检测器的 C# 端口。

查德夏普

如果您想更加确定您使用的是正确的,您可能正在寻找不应该存在的特殊字符。它不太可能包括“óké”。因此,您可能正在寻找此类字符并尝试使用不同的编码/字符集来处理您的文件。

实际上,让你的应用程序完全“万无一失”真的很难。

于 2014-01-23T09:06:23.273 回答