128

我正在尝试使用 Python 中的 Requests 模块发布登录网站的请求,但它并没有真正起作用。我是新手......所以我不知道是否应该制作我的用户名和密码 cookie 或我发现的某种类型的 HTTP 授权 (??)。

from pyquery import PyQuery
import requests

url = 'http://www.locationary.com/home/index2.jsp'

所以现在,我想我应该使用“post”和cookie....

ck = {'inUserName': 'USERNAME/EMAIL', 'inUserPass': 'PASSWORD'}

r = requests.post(url, cookies=ck)

content = r.text

q = PyQuery(content)

title = q("title").text()

print title

我有一种感觉,我做错了饼干……我不知道。

如果没有正确登录,主页的标题应该是“Locationary.com”,如果是,它应该是“主页”。

如果您能向我解释一些关于请求和 cookie 的事情并帮助我解决这个问题,我将不胜感激。:D

谢谢。

...它仍然没有真正起作用。好的...所以这是主页 HTML 在您登录之前所说的内容:

</td><td><img src="http://www.locationary.com/img/LocationaryImgs/icons/txt_email.gif">    </td>
<td><input class="Data_Entry_Field_Login" type="text" name="inUserName" id="inUserName"  size="25"></td>
<td><img src="http://www.locationary.com/img/LocationaryImgs/icons/txt_password.gif"> </td>
<td><input  class="Data_Entry_Field_Login"  type="password" name="inUserPass"     id="inUserPass"></td>

所以我认为我做得对,但输出仍然是“Locationary.com”

第二次编辑:

我希望能够长时间保持登录状态,并且每当我请求该域下的页面时,我希望内容显示为好像我已登录一样。

4

6 回答 6

286

我知道您已经找到了另一种解决方案,但是对于像我这样发现这个问题的人来说,寻找相同的东西,可以通过以下请求来实现:

首先,就像 Marcus 所做的那样,检查登录表单的来源以获得三条信息——表单发布到的 url,以及用户名和密码字段的名称属性。在他的示例中,它们是 inUserName 和 inUserPass。

完成后,您可以使用requests.Session()实例向登录 url 发出 post 请求,并将您的登录详细信息作为有效负载。从会话实例发出请求与正常使用请求基本相同,它只是增加了持久性,允许您存储和使用 cookie 等。

假设您的登录尝试成功,您可以简单地使用会话实例向站点发出进一步的请求。识别您的 cookie 将用于授权请求。

例子

import requests

# Fill in your details here to be posted to the login form.
payload = {
    'inUserName': 'username',
    'inUserPass': 'password'
}

# Use 'with' to ensure the session context is closed after use.
with requests.Session() as s:
    p = s.post('LOGIN_URL', data=payload)
    # print the html returned or something more intelligent to see if it's a successful login page.
    print p.text

    # An authorised request.
    r = s.get('A protected web page url')
    print r.text
        # etc...
于 2013-07-13T18:32:18.403 回答
57

如果您想要的信息在您登录后立即被定向到的页面上...

让我们改为调用您的ck变量payload,就像在python-requests文档中一样:

payload = {'inUserName': 'USERNAME/EMAIL', 'inUserPass': 'PASSWORD'}
url = 'http://www.locationary.com/home/index2.jsp'
requests.post(url, data=payload)

除此以外...

请参阅下面的https://stackoverflow.com/a/17633072/111362

于 2012-08-09T22:21:48.950 回答
46

让我试着简单点,假设站点的 URL 是http://example.com/,假设你需要填写用户名和密码来注册,所以我们去登录页面说http://example。 com/login.php现在查看它的源代码并搜索它将在表单标记中的操作 URL,例如

 <form name="loginform" method="post" action="userinfo.php">

现在使用 userinfo.php 创建绝对 URL,即“ http://example.com/userinfo.php ”,现在运行一个简单的 python 脚本

import requests
url = 'http://example.com/userinfo.php'
values = {'username': 'user',
          'password': 'pass'}

r = requests.post(url, data=values)
print r.content

我希望有一天这对某个地方的人有所帮助。

于 2015-02-20T12:07:52.087 回答
11

requests.Session()解决方案协助登录到具有 CSRF 保护的表单(如在 Flask-WTF 表单中使用的)。检查是否csrf_token需要 a 作为隐藏字段,并使用用户名和密码将其添加到有效负载中:

import requests
from bs4 import BeautifulSoup

payload = {
    'email': 'email@example.com',
    'password': 'passw0rd'
}     

with requests.Session() as sess:
    res = sess.get(server_name + '/signin')
    signin = BeautifulSoup(res._content, 'html.parser')
    payload['csrf_token'] = signin.find('input', id='csrf_token')['value']
    res = sess.post(server_name + '/auth/login', data=payload)
于 2019-07-27T11:44:16.760 回答
7

找出网站表单上用于用户名<...name=username.../>和密码的输入的名称,<...name=password../>并在下面的脚本中替换它们。还要替换 URL 以指向要登录的所需站点。

登录.py

#!/usr/bin/env python

import requests
from requests.packages.urllib3.exceptions import InsecureRequestWarning
requests.packages.urllib3.disable_warnings(InsecureRequestWarning)
payload = { 'username': 'user@email.com', 'password': 'blahblahsecretpassw0rd' }
url = 'https://website.com/login.html'
requests.post(url, data=payload, verify=False)

disable_warnings(InsecureRequestWarning)当尝试使用未经验证的 SSL 证书登录站点时,使用将使脚本的任何输出静音。

额外的:

要在基于 UNIX 的系统上从命令行运行此脚本,请将其放置在一个目录中,home/scripts即将此目录添加到您的路径~/.bash_profile或终端使用的类似文件中。

# Custom scripts
export CUSTOM_SCRIPTS=home/scripts
export PATH=$CUSTOM_SCRIPTS:$PATH

然后在里面创建一个指向这个python脚本的链接home/scripts/login.py

ln -s ~/home/scripts/login.py ~/home/scripts/login

关闭你的终端,启动一个新的,运行login

于 2017-01-27T15:03:23.910 回答
3

某些页面可能需要的不仅仅是登录/通过。甚至可能有隐藏字段。最可靠的方法是使用检查工具并在登录时查看网络选项卡,以查看正在传递哪些数据。

于 2020-10-29T22:50:22.770 回答