0

我无法使用 Python 中的请求库发送 POST 数据以访问我的帐户。结果soup与未发送 POST 相同 这是我一直在使用并在不同站点上工作的代码:

def get_data(final_url):
    payload = {'session[email]':'myemail@myemail.com','session[password]':'mypwd','session[remember_me]':'0','commit':'Sign in'}
    with requests.session() as ses:
        log_soup = BeautifulSoup(ses.get('https://www.login-page.com/login').text)
        payload['utf8'] = log_soup.findAll('input',attrs={'name':'utf8'})[0].get('value')
        payload['authenticity_token'] = log_soup.findAll('input',attrs={'name':'authenticity_token'})[0].get('value')
        ses.post('https://www.login-page.com/login',data=payload)
        req = ses.get(final_url)

        soup = BeautifulSoup(req.text)

    return soup


<form accept-charset="UTF-8" action="/sign_in" class="main_form" id="new_session" method="post" novalidate="novalidate"><div style="margin:0;padding:0;display:inline"><input name="utf8" type="hidden" value="&#x2713;"/><input name="authenticity_token" type="hidden" value="l5+2s90FtEUsS3GHlr2tAktcxSW8jqgXx3mXEwIlAzE="/></div><div class="error_message">
</div>
<dl>
<dt><label for="session_email">Email</label></dt>
<dd>
<div class="input_border"><input autofocus="autofocus" class="text required email" id="session_email" name="session[email]" placeholder="Email" size="30" type="email"/></div>
</dd>
</dl>
<dl>
<dt><label for="session_password">Password</label></dt>
<dd>
<div class="input_border"><input class="text required" id="session_password" name="session[password]" placeholder="Password" size="30" type="password"/></div>
</dd>
</dl>
<div class="checkbox_field"><input name="session[remember_me]" type="hidden" value="0"/><input id="session_remember_me" name="session[remember_me]" type="checkbox" value="1"/><label for="session_remember_me">Remember me</label></div>
<table class="buttons">
<tr>
<td><input class="button public" data-disable-with="Please wait..." name="commit" type="submit" value="Sign in"/></td>
<td class="forgot_password"><a href="/passwords/new">Forgot your password?</a></td>
</tr>
</table>
</form>

手动登录后得到的POST数据如下:

utf8:✓
authenticity_token:l5+2s90FtEUsS3GHlr2tAktcxSW8jqgXx3mXEwIlAzE=
session[email]:myemail@myemail.com
session[password]:mypwd
session[remember_me]:0

非常感谢您的帮助!

4

1 回答 1

2

您使用的是什么版本的请求?如果它介于 0.14.x 和 1.2.0 之间,则必须升级到 1.2.0。会话中的 Cookie 不会在重定向时正确设置,1.2.0 修复了这个问题。

另一个问题是,您可能应该检查来自ses.post(url, data=payload). 您绝对应该检查您是否收到了正确的状态代码(在这种情况下,因为您期待重定向)类似于 301 或 302 的内容。

假设上述所有检查均已完成,您的网站可能正在进行一些时髦的User-Agent分析,您可能还想使用浏览器用户代理字符串进行检查,例如,

ses.headers['User-Agent'] = '...'
response = ses.post(url, data=payload)
final_response = ses.get(final_url)
于 2013-05-10T19:43:20.487 回答