这可能是一个重复的问题,但我不知道要查找哪些搜索词,所以如果以前有人问过,请不要难为我(我很确定是这样)。
因此,我使用该类获取网页的源代码WebClient
并将整个字符串保存在source
变量中:
var client = new WebClient();
client.Headers.Add("user-agent", "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; .NET CLR 1.0.3705;)");
var data = client.OpenRead(urlAddress);
var reader = new StreamReader(data);
var source = reader.ReadToEnd();
data.Close();
reader.Close();
现在我想处理source
变量中的某些文本范围,尤其是用户发布的消息。现在的问题是,在网页中,源“&”实际上是&
,“'”是’
,引号 (") 是–
, “
,”
谁知道还有什么。
好吧,我可以使用字符串方法将这些代码替换为实际符号Replace
,但我想知道是否有办法将所有这些代码转换为实际(预期)符号。有没有一种方法可以做到这一点,或者互联网上的图书馆或一些实用程序类?