目标
使用 python 请求等登录到这个网站(https://www.reliant.com)(我知道这可以用 selenium 或 PhantomJS 或其他东西来完成,但不希望这样做)
问题
在登录过程中,有几个重定向,其中传递了“会话 ID”类型的参数。其中大部分我可以得到,但有一个dtPC
似乎来自您第一次访问该页面时获得的 cookie。据我所知,cookie 来自这个 JS 文件(https://www.reliant.com/ruxitagentjs_ICA2QSVfhjqrux_10175190917092722.js)。这个 url 是浏览器在主 url 的初始 GET 之后执行的下一个 GET 请求。到目前为止,我尝试过的所有方法都未能让我得到那个 cookie。
到目前为止的代码
from requests_html import HTMLSession
url=r'https://www.reliant.com'
url2=r'https://www.reliant.com/ruxitagentjs_ICA2QSVfhjqrux_10175190917092722.js'
headers={
'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3',
'Accept-Encoding': 'gzip, deflate, br',
'Accept-Language': 'en-US,en;q=0.9',
'Cache-Control': 'max-age=0',
'Connection': 'keep-alive',
'Host': 'www.reliant.com',
'Sec-Fetch-Mode': 'navigate',
'Sec-Fetch-Site': 'none',
'Sec-Fetch-User': '?1',
'Upgrade-Insecure-Requests': '1',
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.3'
}
headers2={
'Referer': 'https://www.reliant.com',
'Sec-Fetch-Mode': 'no-cors',
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.132 Safari/537.36'
}
s=HTMLSession()
r=s.get(url,headers=headers)
js=s.get(url2,headers=headers2).text
r.html.render() #works but doesn't get the cookie
r.html.render(script=js) #fails on Network error