1

我在抓取没有单个根的项目时遇到了麻烦。我相信X 光检查是必要的

考虑抓取每个标题由两个 TR 组成的黑客新闻:

<tbody>
  <tr class="athing>content item 1</tr>
  <tr>content item 1</tr>
  <tr class="spacer></tr>
  <tr class="athing>content item 2</tr>
  <tr>content item 2</tr>
  <tr class="spacer></tr>
</tbody>

可以看出,每个项目没有共同的根节点。

在这种情况下,X 射线是否支持刮擦?

4

1 回答 1

0

您可以使用 + 选择兄弟姐妹

x(html, 'tbody ',
    ['tr.athing, tr.athing+tr:not(.athing):not(.spacer)']
)
(function (err, res) {
    console.log(res)
})

结果:

[ 'content item 1a',
  'content item 1b',
  'content item 2a',
  'content item 2b' ]
于 2018-06-25T12:47:23.380 回答