0

您将如何使用 python urllib2 登录到这样设置的网站

下面是表单上的 javascript 处理程序和 onsubmit。我将如何在 python 中处理这个?

<script>

function handleLogin() {document.login.un.value = document.login.username.value;document.login.width.value = screen.width;document.login.height.value = screen.height;}

</script>

下面是包含要作为帖子发送的所有组件的 html 表单。让我坚持的是 onsubmit 功能。

<form id='login' name='login' method='post' onsubmit="handleLogin();" action='login.php'>

<input class="txtbox glow" type="text" id="username" name="username" value="blanksss">

<input class="txtbox glow" type="password" id="password" name="pw" size="18" autocomplete="off" onkeypress="checkCaps(event)">

<input class="checkbox" type="checkbox" id="rememberUn" name="rememberUn" checked="checked">

<input class="loginButton" type="submit" id="Login" name="Login" value="Login">

</form>

我拥有的适用于没有 javascript 的简单网站的 Python 代码是:

cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
opener.addheaders.append(('User-agent', 'Mozilla/4.0'))
opener.addheaders.append( ('Referer', 'https://login.site.com/') )
login_data = urllib.urlencode({'username' : 'mylogin',
                               'pw' : 'mypass',
                               'Login' : 'Login',
                               'rememberUn' : 'checked'
                               })
resp = opener.open('https://login.site.com/', login_data)
website = opener.open('https://eu1.site.com/a03/o')

bowl = BeautifulSoup(website)

关于如何处理 javascript 代码然后将完成的结果发布到表单的操作的任何想法?

谢谢

4

2 回答 2

0

是的,您可以使用 Web 开发人员工具尝试找出发送到服务器的内容,也可以使用 selenium webdriver 来驱动实际的浏览器。您甚至可以使用 xvfb 无头执行此操作。

from selenium import webdriver

browser = webdriver.Chrome()
browser.get('http://some_url.com')
browser.find_element_by_id('username').send_keys('your_login') 
browser.find_element_by_id('password').send_keys('your_password')
browser.find_element_by_id('Login').click() 

print browser.page_source
browser.close()

您需要在路径中包含chromedriver 可执行文件

于 2012-08-04T10:12:26.703 回答
0

使用请求

import requests

data = {
      "username" : "youruser",
      "password" : "yourpass",
      "Login" : "Login",
}
r = requests.post(url, data=data)

此脚本适用于 Python 2.7

于 2018-02-07T16:40:15.380 回答