可能重复:
如何在 C# 中解码 HTML 字符?
我在将 strToCheck 下面的字符串从 html 编码版本转换为其实际的 UTF-8 表示时遇到问题。
// Code sample:
string result = null;
// HTML-encoded Input String (From Google Translate API) , renders "भारत महान देश है." in Hindi language.
string strTocheck = "भारत महान देश है.";
using (var sw = new StreamWriter(File.Open(@"c:\myfile.txt", FileMode.OpenOrCreate), Encoding.UTF8)) // UTF-8 encoding
{
sw.WriteLine(strTocheck);
}
System.IO.StreamReader reader = new System.IO.StreamReader(@"c:\myfile.txt", Encoding.UTF8); // UTF-8 encoding
result = reader.ReadToEnd();
MessageBox.Show(result);
// I expected "भारत महान देश है."
// But got output : भारत महान देश है.
任何帮助将不胜感激。谢谢你。
图片在这里(请在新标签中打开)>> http://i.stack.imgur.com/xcctU.png