我试过用谷歌搜索,但找不到下面这段文字所属的字符集:
具有éœé›»ç”¢ç”Ÿè£ç½®ä¹‹å½±åƒè¼¸å…¥è£ç½®
但是<meta http-equiv="Content-Type" Content="text/html; charset=utf-8">
将该字符串放入 HTML 文件并保存,我能够正确查看中文字符:
具有靜電產生裝置之影像輸入裝置
所以我的问题是:
我可以使用哪些工具来检测此文本的字符集?
以及如何在 C# 中正确转换/编码/解码它们?
更新:为了完整起见,我更新了这个测试。
[TestMethod]
public void TestMethod1()
{
string encodedText = "具有éœé›»ç”¢ç”Ÿè£ç½®ä¹‹å½±åƒè¼¸å…¥è£ç½®";
Encoding utf8 = new UTF8Encoding();
Encoding window1252 = Encoding.GetEncoding("Windows-1252");
byte[] postBytes = window1252.GetBytes(encodedText);
string decodedText = utf8.GetString(postBytes);
string actualText = "具有靜電產生裝置之影像輸入裝置";
Assert.AreEqual(actualText, decodedText);
}
}