1

我一直在阅读有关 Python 的 urllib2 打开和读取受密码保护的目录的能力,但即使在查看了文档中的示例以及 StackOverflow 上的示例之后,我也无法让我的脚本工作。

import urllib2
# Create an OpenerDirector with support for Basic HTTP Authentication...
auth_handler = urllib2.HTTPBasicAuthHandler()
auth_handler.add_password(realm=None,
                    uri='https://webfiles.duke.edu/',
                    user='someUserName',
                    passwd='thisIsntMyRealPassword')
opener = urllib2.build_opener(auth_handler)
# ...and install it globally so it can be used with urlopen.
urllib2.install_opener(opener)
socks = urllib2.urlopen('https://webfiles.duke.edu/?path=/afs/acpub/users/a')
print socks.read()
socks.close()

当我打印内容时,它会打印登录屏幕的内容,我试图打开的网址会将您重定向到。有谁知道这是为什么?

4

1 回答 1

3

auth_handler仅用于基本 HTTP 身份验证。此处的站点包含一个 HTML 表单,因此您需要将您的用户名/密码作为 POST 数据提交。

我建议您使用mechanize可以为您简化登录的模块。

快速示例:

import mechanize

browser = mechanize.Browser()

browser.open('https://webfiles.duke.edu/?path=/afs/acpub/users/a')

browser.select_form(nr=0)

browser.form['user'] = 'username'
browser.form['pass'] = 'password'
req = browser.submit()

print req.read()
于 2010-08-20T12:54:21.680 回答