xml - 无法使用 ImportXML 获取数据

Question

我正在尝试使用 google Docs 电子表格中的以下公式从 CraigsList 中的帖子正文中获取文本，但保留一条错误消息，指出“XPATH 查询未返回任何数据”。

我使用的公式是，

=ImportXML(D2,"//section[@id='postingbody']")

我查看了几个参考来检查我的公式，但我不知道出了什么问题。任何帮助深表感谢。提前谢谢你！:)

score 0 · Accepted Answer

0

试试这个Xpath表达式：

//*[@id="postingbody"]/text()

于 2013-02-11T02:23:55.233 回答

score 0 · Accepted Answer

它可能只是 craigslist 阻止它，他们的抓取规则非常严格。

你可以尝试两件事，你可能需要玩弄你想提取的部分或你想如何格式化它：

你可以试试：=REGEXEXTRACT(concatenate(IMPORTXML(A1,"//html")),".避免诈骗(. \n?.*) 不要")

或尝试：=importxml(A1,"//html")

或者最后：=importxml(A1,"//body")

2 回答 2