我正在尝试使用 import.io 抓取该网站:ScoreCard
我能够成功获得击球得分,但我想在最后插入额外的列,它可以告诉我有关局数的信息。所以它应该与击球手的名字有关。
我尝试使用 XPATH://*[@id="innings_1"]/div[1]/div/h4/b
但这将始终返回 First Inning as ID is "innings_1"
。其他 IDinnings_2/3/4
等等。在 XPATH 中有什么方法可以让我获得与 Batsman 列相关的这个元素吗?
这是我为获得所需结果所做的事情:
我使用了以下 XPATH 值。.//a/ancestor::div/div[1]/div/h4/b
.//a 为我提供了击球手的名字。我搜索了它的祖先,路径 div[1]/div/h4/b 仅被 Innings 部分使用。所以它成功了:)
尝试使用starts-with():
//*[starts-with(@id,'innings_')/div/div/h4/b