4

我正在使用 Bing Web Search API v7,我正在发送以下请求(选定的几个):

/bing/v7.0/search?q=mate%C5%99sk%C3%A1%20%C5%A1kola&count=50&offset=0&responseFilter=Webpages
/bing/v7.0/search?q=mate%C5%99sk%C3%A1%20%C5%A1kola&count=50&offset=50&responseFilter=Webpages
/bing/v7.0/search?q=mate%C5%99sk%C3%A1%20%C5%A1kola&count=50&offset=950&responseFilter=Webpages
/bing/v7.0/search?q=mate%C5%99sk%C3%A1%20%C5%A1kola&count=50&offset=1000&responseFilter=Webpages
/bing/v7.0/search?q=mate%C5%99sk%C3%A1%20%C5%A1kola&count=50&offset=1050&responseFilter=Webpages
  • 第一个搜索查询请求offset=0返回 50 条记录,值为totalEstimatedMatches > 50000.

  • 第二个请求offset=50返回另外 50 条记录,值 totalEstimatedMatches不同,但仍高于 50000。

  • 依此类推,偏移量增加(上面未介绍)。

  • 但是,带有offset=1000或任何值的请求offset >= 1000 提供的结果记录与在请求中返回的记录相同offset=950

这种行为实际上对应于MS Bing网络搜索 - 当我点击page 101with offset 1001(或任何更高的页面)时,我实际上得到page 96offset 951.

所以,我想不出任何方法来访问超过 1000 个结果,即使它们应该超过 50000 个(我知道 totalEstimatedMatches 只是一个估计值,实际值可能会有所不同)。

有谁知道如何获得超过 1000 个网页结果(超过 100 页有 10 条记录/超过 20 页有 50 条记录)?

4

1 回答 1

2

搜索引擎优化其索引并返回比 totalEstimatedMatches 更少的结果,以 1) 停止提供重复页面和 2) 仅关注热门页面的相关性。大部分(如果不是 99.x%)用户在前 2-3 页没有找到结果时会更改查询。因此,对于搜索引擎而言,可能不值得为给定查询存储数十亿页的索引。请注意,这种行为在所有搜索引擎中都很常见,而不仅仅是 Bing。

于 2018-01-11T17:46:13.170 回答