根据 Google 自定义搜索 API 的文档:http ://code.google.com/apis/customsearch/docs/start.html#sites最多可以搜索 5000 个站点。这很蹩脚。有什么办法可以让我使用谷歌的结果搜索整个网络?
此外,如果您包含一堆匹配超过 5000 个网站的 url 模式,API 将如何选择要包含哪些站点以及要排除哪些站点?
根据 Google 自定义搜索 API 的文档:http ://code.google.com/apis/customsearch/docs/start.html#sites最多可以搜索 5000 个站点。这很蹩脚。有什么办法可以让我使用谷歌的结果搜索整个网络?
此外,如果您包含一堆匹配超过 5000 个网站的 url 模式,API 将如何选择要包含哪些站点以及要排除哪些站点?
这是用于自定义搜索,而不是普通的 Google 搜索。例如,如果您拥有 abc.com 和 acme.com,您可以为您的客户在这两个域上设置自定义搜索。这样,他们就可以搜索您的网站以获取信息。5,000 个站点的限制实际上是巨大的。我不确定我能想出一个使用那么多指定站点的应用程序。
我认为您正在寻找的是搜索所有 Google 的 Google Web Search API。不幸的是,现在已经贬值了。(参考:http ://code.google.com/apis/websearch/ )您仍然可以使用旧 API,但这是有风险的,因为 Google 保留随时关闭它的权利。他们还将限制您每天执行的搜索次数(尽管我找不到该限制的具体数字)。这是他们条款的链接: http ://code.google.com/apis/websearch/terms.html
如果您真的想将 API 直接集成到您的代码中,我建议您查看其他搜索引擎的 API。一个不同的建议是将您的搜索信息放在一个界面后面,并暂时将其编码到 Google。然后,如果他们将其关闭或出现更好的东西,您可以仅更改搜索代码以指向最新和最好的 API。
谷歌自定义搜索实际上可以搜索整个网络,虽然设置不明显。请参阅“搜索整个网络”。
您可能遇到的其他问题是:
可悲的是,“升级”到 Google Site Search以能够搜索整个网络为代价消除了问题 #2 。
如果您在自己的网站 https://www.google.com/cse/docs/cref.html上托管链接的规范 CSE 文件,则可以突破5000 个限制