0

在您停止阅读并建议 HTML Agility(基于标题)之前,我已经在使用这个工具了。问题是这样的:我有一个网页,列出了一大堆案件编号,并有指向个别案件编号页面的链接。我的应用程序已下载此信息并将其显示在datagridview. 但是在我的应用程序中,我还需要来自各个案例编号页面(链接)的信息。

问题是我已经知道使用 HTML 敏捷性需要很长时间才能获得。获取案例页面大约需要 2 分钟。代码方面,我正在为 HTML 代码提供 HTML 敏捷性,将单元格值添加到数组中,并解析出要在网格中显示的数组索引。这是页面上组件数量的一个非常大的数组解析。

从链接页面获取主页和特定单元格的任何想法?

4

1 回答 1

1

展示如何在 HmtlAgility 中使用 XPath 的示例

HtmlDocument 文档 = 新 HtmlDocument(); doc.LoadHtml(yourHtml);

示例 1 : //下面的示例将获取所有带有类的 div 作为容器 foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//div[@class='container']")) {
Console.Writeline(node.InnerText ); }

示例 2 : //下面的示例将在 doc.DocumentNode.SelectNodes("//div[@class='container'][1]")) 中获取第一个 div,类为容器 HtmlNode 节点

Console.Writeline(node.InnerText);

您可以使用 Xpath 查询来获取所需的元素

对于 XPath 语法等,请使用链接http://www.w3schools.com/xpath/xpath_syntax.asp

于 2012-07-19T07:49:09.627 回答