2

这可能是一个重复的问题,但我不知道要查找哪些搜索词,所以如果以前有人问过,请不要难为我(我很确定是这样)。

因此,我使用该类获取网页的源代码WebClient并将整个字符串保存在source变量中:

var client = new WebClient();
client.Headers.Add("user-agent", "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; .NET CLR 1.0.3705;)");
var data = client.OpenRead(urlAddress);
var reader = new StreamReader(data);
var source = reader.ReadToEnd();
data.Close();
reader.Close();

现在我想处理source变量中的某些文本范围,尤其是用户发布的消息。现在的问题是,在网页中,源“&”实际上是&,“'”是’,引号 (") 是–, “”谁知道还有什么。

好吧,我可以使用字符串方法将这些代码替换为实际符号Replace,但我想知道是否有办法将所有这些代码转换为实际(预期)符号。有没有一种方法可以做到这一点,或者互联网上的图书馆或一些实用程序类?

4

1 回答 1

4

尝试使用HttpUtility.HtmlDecodeHttpServerUtility.HtmlDecode

于 2012-09-11T16:45:29.287 回答