0

我正在寻找一种方法来检索给定查询的搜索结果数量(如在谷歌结果页面上)。目的是使用搜索 API 实现标准化的谷歌距离(http://iknowate.blogspot.com/2011/10/google-similarity-distance.html);主要问题是请求的数量不应该太有限(google api 似乎只允许每天约 100 个查询)。

也许有人可以给我一个提示,我可以如何检索这些信息。

4

1 回答 1

0

您可以使用第三方库/类来抓取结果页面,然后遍历 DOM 来获取您的信息,或者使用 file_get_contents 来获取页面,然后使用 preg_match 来获取结果总数。另一种选择是使用 CURL 抓取页面,如果您打算多次抓取页面,这也可以让您将脚本隐藏在多个代理后面以防止任何类型的禁令。

于 2012-05-27T23:22:49.313 回答