c# - Html 敏捷包。加载和抓取网页

Question

这是抓取时获取网页的最佳方式吗？

HttpWebRequest oReq = (HttpWebRequest)WebRequest.Create(url);
HttpWebResponse resp = (HttpWebResponse)oReq.GetResponse();

var doc = new HtmlAgilityPack.HtmlDocument();

doc.Load(resp.GetResponseStream());
var element = doc.GetElementbyId("//start-left");
var element2 = doc.DocumentNode.SelectSingleNode("//body");
string html = doc.DocumentNode.OuterHtml;

我已经看到HtmlWeb().Load了一个网页。这是加载和抓取网页的更好选择吗？

好的，我会尝试。

HtmlDocument doc = web.Load(url);

现在，当我得到我的doc并没有得到如此多的财产时。没有人喜欢SelectSingleNode。我唯一可以使用的是GetElementById，这很有效，但我想上课。

我需要这样做吗？

var htmlBody = doc.DocumentNode.SelectSingleNode("//body");
htmlBody.SelectSingleNode("//paging");

score 73 · Accepted Answer

使用 HtmlWeb 更容易。

string Url = "http://something";
HtmlWeb web = new HtmlWeb();
HtmlDocument doc = web.Load(Url);

c# - Html 敏捷包。加载和抓取网页

1 回答 1

Related

Reference