python - urllib.urlopen 返回一个旧页面？

Question

所以我有一个非常简单的 HTML 页面（一个目录列表），我尝试用 urllib 读取它，这样：

page =  urllib.urlopen(coreRepositoryUrl).read()

问题是，我以这种方式阅读的 HTML 比最新的要旧。info()给我这个：

Date: Fri, 19 Apr 2013 18:48:09 GMT
Server: Apache/2.0.52 (Fedora)
Content-Type: text/html; charset=UTF-8
Connection: close
Age: 481084

该页面最后一次更新是今天（2013-04-25）。哪个组件可能是缓存的组件？

score 3 · Accepted Answer

在您的请求中添加值为“max-age=0”的标头“Cache-Control”

import urllib2
req = urllib2.Request(url)
req.add_header('Cache-Control', 'max-age=0')
resp = urllib2.urlopen(req)
content = resp.read()

沿途使用该标头的每个缓存都将重新验证其缓存条目

1 回答 1