c# - 写入文件时如何从 HTML 编码转换为 UTF 8？

Question

可能重复：
如何在 C# 中解码 HTML 字符？

我在将 strToCheck 下面的字符串从 html 编码版本转换为其实际的 UTF-8 表示时遇到问题。

// Code sample:    
string result = null;

// HTML-encoded Input String (From Google Translate API) , renders "भारत महान देश है." in Hindi language.
string strTocheck = "&#2349;&#2366;&#2352;&#2340; &#2350;&#2361;&#2366;&#2344; &#2342;&#2375;&#2358; &#2361;&#2376;.";

using (var sw = new StreamWriter(File.Open(@"c:\myfile.txt", FileMode.OpenOrCreate), Encoding.UTF8)) // UTF-8 encoding
{
    sw.WriteLine(strTocheck);
}

System.IO.StreamReader reader = new System.IO.StreamReader(@"c:\myfile.txt", Encoding.UTF8); // UTF-8 encoding
result = reader.ReadToEnd();
MessageBox.Show(result);

// I expected "भारत महान देश है."
// But got output : &#2349;&#2366;&#2352;&#2340; &#2350;&#2361;&#2366;&#2344; &#2342;&#2375;&#2358; &#2361;&#2376;.

任何帮助将不胜感激。谢谢你。

图片在这里（请在新标签中打开）>> http://i.stack.imgur.com/xcctU.png

score 0 · Accepted Answer

它按预期工作，您只是没有按预期使用它：p

请参阅UTF8 在 Excel 中不起作用

和http://social.msdn.microsoft.com/Forums/en/csharpgeneral/thread/433ecab8-f800-4376-b351-4bbce93679d9链接到MySQL C# Text Encoding Problems

c# - 写入文件时如何从 HTML 编码转换为 UTF 8？

1 回答 1

Related

Reference