所以我有一个 sub-reddits 列表,我正在使用 urllib 打开它们。当我浏览它们时,最终 urllib 失败了:
urllib2.HTTPError: HTTP Error 429: Unknown
做了一些研究,我发现 reddit 通过 IP 限制了对其服务器的请求数量:
每两秒发出不超过一个请求。有一些请求突发的余地,但要保持理智。一般来说,保持在一分钟内不超过 30 个请求。
所以我想我会使用time.sleep()
将我的请求限制为每 10 秒一页。这最终也会失败。
上面的引用来自reddit API页面。我没有使用 reddit API。在这一点上,我在想两件事。该限制仅适用于 reddit API,或者 urllib 也有限制。
有谁知道这是这两件事中的哪一件?或者我该如何解决这个问题?