1

用于将数据从 Wikipedia 提取到 Google Sheets 的正确 Xpath 查询是什么?

这是一个我想测试的例子:

维基百科页面:http://en.wikipedia.org/wiki/12_Angry_Men_(1957_film)

要提取的数据:位于右侧表格中的“96 分钟”的“运行时间”值

方法:使用 Google Sheets ImportXML 函数

我尝试了以下方法,但它返回 N/A:

=IMPORTXML("http://en.wikipedia.org/wiki/12_Angry_Men_(1957_film)", "//div[normalize-space() = 'Running time']/following-sibling::td")

谢谢!

4

1 回答 1

0

您的 XPath 存在一些问题。

following-sibling轴不适用于该页面的标记,因为td以下 'Running time'div是其 parent 的兄弟th。相反,将following轴与节点类型选择器一起使用:following::td. 但是,它仍然返回tdselected 之后的所有节点div,因此我们还需要一个谓词来仅选择第一个节点:[1]

使用 XPath 完成功能:

=IMPORTXML("http://en.wikipedia.org/wiki/12_Angry_Men_%281957_film%29", "//div[normalize-space()='Running time']/following::td[1]")
于 2015-03-28T22:03:35.903 回答