0

我正在阅读urllib2教程,其中提到为了访问需要身份验证的页面(例如有效的用户名和密码),服务器首先发送HTTP带有错误代码 401 的标头,然后(python)客户端发送带有身份验证详细信息的请求。

现在,我的问题是存在两种不同版本的网页,一种可以在不提供任何身份验证详细信息的情况下访问,另一种在提供身份验证详细信息时完全不同(即当用户登录系统时) . 例如,考虑 url www.gmail.com,当您未登录时,您会获得一个登录页面,但如果您的浏览器从您上次登录时记住了您,那么结果就是您的电子邮件帐户主页,其中显示了您的收件箱。

我按照所有细节设置一个handler用于身份验证并安装一个opener. 但是,每次我请求页面时,都会返回没有用户登录的网页版本。

如何访问已登录用户的其他版本网页?

4

2 回答 2

1

请求使这很容易。正如它的创造者所说:

Python 的标准 urllib2 模块提供了您需要的大部分 HTTP 功能,但 API 被彻底破坏了。

于 2013-05-15T03:36:40.490 回答
1

尝试使用机械化。它具有 cookie 处理功能,可以让您的程序“登录”,即使它不是真人。

于 2013-05-15T03:22:58.210 回答