我正在使用 mechanize 浏览器进行一些网页抓取并使用以下代码。我意识到在某些情况下,尽管远程页面已经更改,但我们仍然获得相同的页面。所以我的问题是:
- 默认情况下(在某些配置中)是否机械化浏览器实例缓存页面?
如果是这样,我们如何更改它,或者有没有办法避免缓存(除了每次在我们网络抓取的循环中创建浏览器实例)
# put int login detail and submit, return a mechanize.Browser instance browser = _login() # main loop while True: rsp = browser.open(URL) html = rsp.read()
谢谢