我在使用 lambda 表达式解析 html 表时遇到了一些困难。
var cells = htmlDoc.DocumentNode
.SelectNodes("//table[@class='data stats']/tbody/tr")
.Select(node => new { playerRank = node.InnerText.Trim()})
.ToList();
foreach (var cell in cells)
{
Console.WriteLine("Rank: " + cell.playerRank);
Console.WriteLine();
}
我想继续使用语法为
.Select(node => new { playerRank = node.InnerText.Trim()
但是对于表格的其他类别,例如球员姓名、球队、位置等。我使用的是 Xpath,所以我不确定它是否正确。
我在找出如何从以下位置提取链接 + 玩家名称时遇到问题:
<a href="/ice/player.htm?id=8474564">Steven Stamkos</a>
它的 Xpath 是:
//*[@id="fullPage"]/div[3]/table/tbody/tr[1]/td[2]/a
任何人都可以帮忙吗?
EDIT* 添加了 HTML 页面。 http://www.nhl.com/ice/playerstats.htm?navid=nav-sts-indiv#