1

我正在尝试编写一个 Python 脚本来将多部分表单发布到需要通过 CAS 进行身份验证的站点。

有两种方法都可以解决部分问题:

  1. Python requests库非常适合提交多部分表单。

  2. 有caslib,有登录功能。它返回一个可能用于进一步请求的 OpenerDirector。

不幸的是,我无法弄清楚如何获得一个完整的解决方案来解决我目前所拥有的。经过几个小时的研究,只有一些想法;我对任何可行的解决方案持开放态度。

谢谢您的帮助。

4

3 回答 3

1

我接受了 JF Sebastian 的回答,因为我认为它最接近我的要求,但实际上我最终通过使用mechanize(用于网络浏览器自动化的 Python 库)让它工作。

import argparse
import mechanize
import re
import sys

# (SENSITIVE!) Authentication info
username = r'username'
password = r'password'

# Command line arguments
parser = argparse.ArgumentParser(description='Submit lab to CS 235 site (Winter 2013)')
parser.add_argument('lab_num', help='Lab submission number')
parser.add_argument('file_name', help='Submission file (zip)')
args = parser.parse_args()

# Go to login site
br = mechanize.Browser()
br.open('https://cas.byu.edu/cas/login?service=https%3a%2f%2fbeta.cs.byu.edu%2f~sub235%2fsubmit.php')

# Login and forward to submission site
br.form = br.forms().next()
br['username'] = username
br['password'] = password
br.submit()

# Submit
br.form = br.forms().next()
br['labnum'] = list(args.lab_num)
br.add_file(open(args.file_name), 'application/zip', args.file_name)
r = br.submit()

for s in re.findall('<h4>(.+?)</?h4>', r.read()):
    print s
于 2013-01-24T08:40:04.617 回答
0

您可以使用 caslib 为请求编写身份验证处理程序。然后你可以做类似的事情:

auth = CasAuthentication("url", "login", "password")
response = requests.get("http://example.com/cas_service", auth=auth)

或者,如果您对网站提出大量请求:

s = requests.session()
s.auth = auth

s.post('http://casservice.com/endpoint', data={'key', 'value'}, files={'filename': '/path/to/file'})
于 2013-01-20T04:09:23.510 回答
0

您可以poster用来准备多部分/表单数据。尝试将海报的开瓶器传递给 caslib 并使用 caslib 的开瓶器发出请求(未经测试):

import urllib2

import caslib
import poster.encode
import poster.streaminghttp

opener = poster.streaminghttp.register_openers()
r, opener = caslib.login_to_cas_service(login_url, username, password,
                                        opener=opener)    
params = {'file': open("test.txt", "rb"), 'name': 'upload test'}
datagen, headers = poster.encode.multipart_encode(params)
response = opener.open(urllib2.Request(upload_url, datagen, headers))
print response.read()
于 2013-01-20T07:29:20.893 回答