当我尝试使用谷歌电子表格中的 xPath 规则从autoscout24获取所有广告标题时:
//div[@id="listOutput"]//div[@class="headcar"]/a/text()
结果为 #NA - xPath 查询未收到任何数据。
但是,当我尝试使用 xPath 规则从同一页面获取其他元素时,例如“Kryteria wyszukiwania:”:
//li/span
输出是正确的。
可能是什么问题呢?
当我尝试使用谷歌电子表格中的 xPath 规则从autoscout24获取所有广告标题时:
//div[@id="listOutput"]//div[@class="headcar"]/a/text()
结果为 #NA - xPath 查询未收到任何数据。
但是,当我尝试使用 xPath 规则从同一页面获取其他元素时,例如“Kryteria wyszukiwania:”:
//li/span
输出是正确的。
可能是什么问题呢?
在 Chrome 中查看的 HTML 源代码中——即“view-source: http://www.autoscout24.pl/ListGN.aspx ?...”不是通过 Firebug 或 Chrome 的检查工具,div#listOutput 仅包含以下内容:
<div id="listOutput">
<div id="listoutput_part_one">
</div>
<div id="divSuperAdPlaceHolder">
</div>
<div id="listoutput_part_two">
</div>
</div>
而源代码确实包含“li/span”,例如:
<li class="breadcrumb-item breadcrumb-first">
<span>Kryteria wyszukiwania:</Span>
</li>
其余元素必须由浏览器运行的一些 Javascript 代码构建,我怀疑 Google 电子表格解释并执行页面中的 Javascript。