0

我正在尝试使用 google Docs 电子表格中的以下公式从 CraigsList 中的帖子正文中获取文本,但保留一条错误消息,指出“XPATH 查询未返回任何数据”。

我使用的公式是,

=ImportXML(D2,"//section[@id='postingbody']")

其中 D2 有发布网址: http: //losangeles.craigslist.org/wst/apa/3608091461.html

我查看了几个参考来检查我的公式,但我不知道出了什么问题。任何帮助深表感谢。提前谢谢你!:)

4

2 回答 2

0

试试这个Xpath表达式:

//*[@id="postingbody"]/text()
于 2013-02-11T02:23:55.233 回答
0

它可能只是 craigslist 阻止它,他们的抓取规则非常严格。

你可以尝试两件事,你可能需要玩弄你想提取的部分或你想如何格式化它:

你可以试试:=REGEXEXTRACT(concatenate(IMPORTXML(A1,"//html")),".避免诈骗(. \n?.*) 不要")

或尝试:=importxml(A1,"//html")

或者最后:=importxml(A1,"//body")

于 2015-12-01T19:17:20.913 回答