4

通过 API 对主要引擎以编程方式运行搜索查询似乎非常困难。

  • 显然,令人惊讶的是,谷歌没有用于搜索的通用 API。他们有一个“自定义搜索引擎”,旨在将谷歌驱动的搜索框添加到给定站点,并仅返回来自几个域的结果。他们的注册页面要求输入网站进行搜索。我尝试在此处输入“ .google.com/ ”和一些变体,但这并没有在我关心的一些晦涩的术语上给我相同的结果(特别是当网络搜索给我结果时没有命中)。
  • 必应搜索确实有一个API,但与他们的网络结果不同,该 API 不报告点击总数。获取结果总数是我的应用程序的一项要求。
  • DuckDuckGo 有一个API,但它似乎没有查询与网络搜索相同的数据库。
  • Blekko 有一个API,但它的速率限制为 1 个请求/秒。我没有尝试过询问他们的定价结构是什么。
  • 我没试过雅虎。

请注意,我很高兴并愿意为此付费,但我仍然找不到服务。任何帮助表示赞赏。

4

2 回答 2

2

blekko API 每秒最多可以免费查询 1 个查询。根据您所做的事情,您可能会发现我们允许您做您在其他地方无法做的事情。有关详细信息,请参阅http://help.blekko.com/index.php/advanced-search-features/。联系 apiauth@blekko.com 获取 API Auth 密钥和文档。

于 2012-06-24T21:40:54.880 回答
1

经过更多的研究和实验,我可以说:

  • Yahoo Boss Search API 效果最好。对于一般的网络搜索,他们从第一次通话开始收取 0.80 美元/1000 次通话费用。API 返回 JSON,包括结果总数。它似乎与网站具有相同的覆盖范围,并且易于使用,但它们需要使用 OAuth 签名的请求(不需要令牌,只需签名);有一些示例 Ruby 代码可以解决问题,并且可以适应使用 OAuth gem。每个请求都限制为最大值。50 个结果,并带有分页标志,可通过单独的查询检索更多结果(每个查询都计费)。
  • 一旦您通过设置屏幕(只需在要搜索的站点中填写 google.com),Google 自定义搜索 API 就有一个仪表板设置,允许切换“常规”网络搜索和自定义站点。该 API 还返回 JSON,只需要请求中的 API 密钥(无需令牌或签名)并返回最多 10 个结果,但也返回结果总数。100 次免费调用后,5000 次 API 调用收费 5 美元。也许最令人沮丧的是,自定义搜索 API 似乎使用了不同的数据库,并且不会在网络上返回相同的结果。许多在网络上获得成功的查询在 API 上都是空白的。
  • Bing API 真的不值得麻烦。我认为 Yahoo 也在后端使用 Bing,但 Yahoo 界面更易于使用且更完整,文档也更好。Bing 的 API 文档是可下载的 Word 文档 (!!!),即使他们的搜索产品现在是 Azure 云的一部分。他们的网站导航是最模糊的。

更新: Blekko 的 Greg Lindahl 亲自回复使用并邀请我们开会。他们非常乐于分享他们的一些数据,还给了我们一个 API 密钥。这是另一个不错的选择,尤其是对于专业数据集,正如我们的案例所需要的那样。

于 2012-06-20T20:54:30.987 回答