0

我正在尝试下载 HTML,以便我可以使用最小带宽来解析它。这是我的一些代码。

if (!String.IsNullOrEmpty(siteAddress))
                webReq = WebRequest.Create(siteAddress)

                WebResponse webRes = webReq.GetResponse();

                Stream streamResponse = webRes.GetResponseStream();
                StreamReader streamRead = new StreamReader(streamResponse);
                StringReader sr = new StringReader(streamRead.ReadToEnd().Trim());

                streamResponse.Close();
                streamRead.Close();    
                webRes.Close();

                HtmlAgilityPack.HtmlDocument hDoc = new HtmlAgilityPack.HtmlDocument();
                hDoc.Load(sr);

有人可以确认检索响应仅提供文本响应,并且也没有下载图像吗?使用 HTMLAgilityPack 方法加载它时会怎样?

4

2 回答 2

2

使用时WebClientWebRequest或者HtmlAgilityPack它只是您将下载的html 。

如果您想要图像(或其他资源),您必须在下载的文档中搜索图像 url 并自己发出请求以获取它们。

如果您想尝试一下,WebBrowser可以查看控件。从那里,您可以获取该Document属性并查看其属性Images并自己下载所有图像。

你想让我做什么?

于 2011-03-17T15:11:14.767 回答
1

您下载的是网站的 HTML 源代码,而不是整个网站。这是一个很大的区别。

请参阅如何使用HTML Agility Pack以及这个

于 2011-03-17T15:10:08.637 回答