我想编写一个函数来识别特定 HTML 页面上的所有链接。我的想法是使用 XPath,通过使用诸如//body//a[x]
增加 x 之类的路径来通过页面上的第一个、第二个、第三个链接。
在 Chrome 中尝试此操作时,我加载页面http://exoplanet.eu/并在 Chrome 开发人员工具 JS 控制台中调用$x("//body//a[1]")
. 我希望页面上的第一个链接,但这会返回多个锚元素的列表。调用$x("//body//a[2]")
返回两个锚元素。调用$x("//body//a[3]")
什么也不返回。
我希望[x]
每次增加都会给我页面上的每个唯一链接,但它们似乎是分组的。我怎样才能重写这条路径,以便我一个接一个地选择每个锚标记?