这是困扰我一段时间的事情。我想编写一个程序,这样我就可以自动登录到我的 PowerSchool 门户网站,将来可能会让我做一些事情,比如分析我的日程安排和成绩。第一步是身份验证,这对我来说已经成为一个问题。
import sys
import os
import requests
import lxml
import json
from bs4 import BeautifulSoup
def login(username, password):
with requests.Session() as s:
url = 'https://sisavrsb.ednet.ns.ca/guardian/home.html#sign-in-content'
r = s.get(url)
soup = BeautifulSoup(r.text, "lxml")
token = soup.select_one("[name='pstoken']")['value']
contextdata = soup.select_one("[name='contextData']")['value']
headers = {
'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
'Accept-Encoding': 'gzip, deflate, br',
'Accept-Language': 'en-US,en;q=0.5',
'Connection': 'keep-alive',
#'Content-Length': '423',
#'Content-Type': 'application/x-www-form-urlencoded',
#'Cookie': 'JSESSIONID=0B1666C446234245CECC2983F1D6CA8A; PowerSchool_Cookie_K=2069644430.1.329063952.2221457792',
'DNT': '1',
#'Host': 'sisavrsb.ednet.ns.ca',
'Referer': 'https://sisavrsb.ednet.ns.ca/public/',
'Upgrade-Insecure-Requests': '1',
'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64; rv:59.0) Gecko/20100101 Firefox/59.0'
}
print(contextdata)
data = json.dumps({
'account': username,
#'contextData': '30A7205567365DDB643E707E25B32D43578D70A04D9F407113CF640632082056',
'contextData' : contextdata,
'credentialType': 'User Id and Password Credential',
#'dbpw': '61a2474517a2f79ae0da0781b9bdf57d',
#'dbpw' : password,
'pcasServerUrl': '\/',
'pstoken': token,
'pw': password,
'returnUrl': '',
'serviceName': 'PS Parent Portal',
'serviceTicket': '',
'translator_ldappassword': '',
'translator_password': '',
'translator_username': '',
'translatorpw': ''
})
p = s.post(url, headers=headers, data=data, allow_redirects=True)
soup = BeautifulSoup(p.text, "lxml")
if p.status_code == 302:
print('Success!')
else:
print('Authentication error', p.status_code)
print('cookies', requests.utils.dict_from_cookiejar(s.cookies))
print(p.history)
print(p.headers)
def main():
login('xxxxx', 'xxxxx')
if __name__ == '__main__':
main()
在这一点上,我已经尝试了几乎所有东西,从 Mechanize 到(过时的)PowerSchool API。我已尽力复制标头和数据,以requests.Session()
使 cookie 正常工作。经过几个小时的摆弄,我终于得到了它,所以 p.history() 不是空白的。它现在包含“ <Response [302]>
”,这对我来说非常模糊,但总比没有好。
这是我的输出
Authentication error 200
cookies {'JSESSIONID': 'B847F853CC373DC7EAA8800FA02EEC00', 'PowerSchool_Cookie_K': '2069644430.1.329063608.2225303936'}
[<Response [302]>]
{'Server': 'Apache-Coyote/1.1', 'Cache-control': 'no-store, no-cache, must-revalidate, post-check=0, check=0', 'Expires': 'Thu, 01 Dec 1994 16:00:00 GMT', 'Content-Type': 'text/html;charset=UTF-8', 'Content-Length': '8238', 'Date': 'Thu, 08 Feb 2018 01:01:05 GMT'}
我已经留下了网站链接,以便您可以使用 POST 请求进行测试并查看标题等。我不知道如何解决这个问题,但我真的很想让这个工作。显然 302 在历史记录中是一个 POST 代码的好兆头,但我仍然无法通过登录。如果我再做一次requests.get()
并打印输出,它将再次成为登录页面。
机械化(引发 500 内部服务器错误):
import mechanize
import cookielib
br = mechanize.Browser()
cj = cookielib.LWPCookieJar()
br.set_cookiejar(cj)
br.set_handle_equiv(True)
br.set_handle_gzip(True)
br.set_handle_redirect(True)
br.set_handle_referer(True)
br.set_handle_robots(False)
br.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(), max_time=1)
# Debugging
br.set_debug_http(True)
br.set_debug_redirects(True)
br.set_debug_responses(True)
br.set_handle_refresh(False)
# Fake User-Agent header
br.addheaders = [('User-Agent', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36')]
br.open('https://sisavrsb.ednet.ns.ca/public/home.html')
#
br.select_form(name='LoginForm')
br.form['account'] = 'xxxxx'
br.form['pw'] = 'xxxxxx'
br.method = 'POST'
response = br.submit()
print response.read()
编辑:RoboBrowser 也给了我 500 响应。想知道这是否是因为我缺少某些东西,或者仅仅是他们的问题。