我最近编写了从 ebay 上抓取信息的 ac# 程序。但是当我最近测试该程序时,我发现了一个奇怪的事情。我使用代码:
WebClient client = new WebClient();
Stream data = client.OpenRead(URL);
StreamReader reader = new StreamReader(data);
string s = reader.ReadToEnd();
this.richTextBox1.Text = s;
data.Close();
reader.Close();
下载网页,从该代码下载的网页与从第三方下载软件(如 flashget)下载的网页版本不同,并且与另一个相比,它也缺少一些信息。有人可以解释一下吗?
从C#下载的html
DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 过渡//EN" "http://www.w3.org/TR/html4/loose.dtd ....
从FlashGet下载的html
文档类型 html .....