HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(content);
var nodes = doc.DocumentNode.SelectNodes("//div[@class=\"noprint res\"]/div");
if (nodes != null)
{
foreach (HtmlNode data in nodes)
{
// Works but not what I want
MessageBox.Show(data.InnerHtml);
// Should work ? but does not ?
MessageBox.Show(data.SelectSingleNode("//span[@class=\"pp-place-title\"]").InnerText);
}
}
我正在尝试解析 HTML 的结果,foreach 的初始节点按预期工作,并为我提供了 10 个符合我需要的项目的结果。
当我进入 foreach 时,如果我输出数据项的内部 html,它会显示正确的数据,但如果我输出 SelectSingleNode,它将始终显示来自 foreach 的第一项的数据,这是正常行为还是我做错了什么?
为了解决这个问题,我必须在 foreach 中为每个数据项创建一个新的 html,如下所示:
HtmlAgilityPack.HtmlDocument innerDoc = new HtmlAgilityPack.HtmlDocument();
innerDoc.LoadHtml(data.InnerHtml);
// Select what I need
MessageBox.Show(innerDoc.DocumentNode.SelectSingleNode("//span[@class=\"pp-place-title\"]").InnerText);
然后我得到正确的每项数据。
我试图从中获取数据的页面是http://maps.google.com/maps?q=consulting+loc:+US如果您想尝试看看自己会发生什么。
基本上我正在阅读公司名称的左侧栏,并且发生了上述情况。