xpath - import.io 的 url 的 Xpath

Question

我在这个网站上获得了提供的工作列表：http: //telekom.jobs/global-careers

我正在尝试获取链接的 XPath 以获取有关工作的更多信息。

这是第一个链接的整个 XPath：

/html/body/div[3]/div/div[2]/div[3]/table/tbody/tr[2]/td/div/a/@href

这就是我应该粘贴到 import.io 的内容：

tr[2]/td/div/a/@href

但它不起作用，我不知道为什么。

指向有关工作机会页面的更多信息的链接具有 XPath：

tr[2]/td/div/a/@href
tr[4]/td/div/a/@href
tr[6]/td/div/a/@href
tr[8]/td/div/a/@href

等等。也许这就是为什么它不起作用？因为数字不是 1,2,3 等，而是 2,4,6？还是我做错了什么？

score 5 · Accepted Answer

如果您从 URL 2.0 创建 API 并在打开 JS 但关闭 CSS 的情况下重新加载网站，您应该能够看到可折叠菜单：

在这个网站上，DOM 的构造方式是所有奇数行都有职位，而有关职位的更多信息隐藏在偶数行中。为此，我们可以使用 XPath 的 position() 属性，因此您可以在手动行训练中使用以下 XPath：

/html/body/div[3]/div/div[2]/div[3]/table/tbody/tr[position() mod 2 = 0]

其中突出显示了更多信息框，仅允许您访问内部数据。从这里您可以简单地定位具有可用标题和链接的元素的特定属性。

链接 xpath:.//a[@class=’forward jobadview’]/@href 标题 xpath:.//div[@class=’info’]//h3

话虽如此，由于网站上大量使用 JS，它可能无法发布，所以我们创建了一个 API 供您查询，您可以在这里使用它来检索相同的数据。

1 回答 1