0

大家好,我设置了一个挑战,我必须解析一个 HTML 页面来找到所有课程的结束日期。我正在使用 HTMLAgilityPack,但这是我第一次使用它,设置它的网页也没有类或 Id,结束日期存储在 Tr H4 标记中。我不确定如何解析任何命中?

我的代码:

HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.Load(txtURL.Text);

sw.WriteLine("GET /academics/academic-calendar/ HTTP/1.1");
sw.WriteLine();
String response = sr.ReadToEnd();

txtHTML.Text = response;
4

2 回答 2

1

HtmlDocument可以查询对象 - 您可以使用XPath查找遵循特定路径或其他约束的所有元素,也可以使用 LINQ 进行查询。

我建议下载源包——它带有许多带有使用示例的项目。

于 2012-06-06T16:36:27.843 回答
1

使用 XPath 可以让您获得所需的东西。这是一个如何从声明的 html 中获取所有表行的示例。

HtmlDocument htmlDocument = Markup.Parser();                                  
htmlDocument.LoadHtml(html);
htmlDocument.DocumentNode.SelectNodes("/tr");
于 2012-06-06T16:37:55.587 回答