现在我面临这样的问题:
假设我有一个网址列表,例如
['http://example.com/1',
'http://example.com/2',
'http://example.com/3',
'http://example.com/4',
...,
'http://example.com/100']
其中一些是不可用的 url,请求这些 url 将导致 302 重定向状态码。例如 .../1 - .../50 是可用的 url,但 .../51 会导致 302。然后 .../50 是我想要的 url。
我想找出哪个 url 是最后一个可用的 url(它不返回 302 代码),我相信二进制搜索会完成这项工作,但我想知道如何以更高的效率实现它。我使用 python 的 urllib2 来检测 302 状态码。
pseg .../1 - .../50 是可用的 url,但 .../51 会导致 302。然后 .../50 是我想要的 url。