我正在尝试提取网页中包含的文本。所以我正在使用第三方工具 Html Agility Pack。他们提到:
HtmlWeb htmlWeb = new HtmlWeb();
HtmlDocument doc = htmlWeb.Load("http://www.msn.com/");
HtmlNodeCollection links = doc.DocumentNode.SelectNodes("//a[@href]");
foreach (HtmlNode link in links)
{
Response.Write(link.Attributes["href"].Value + "<br>");
}
我可以抓取页面中包含的所有其他链接。但我想获取该页面中包含的所有文本数据。是否可以?