4

可能重复:
Python:如何登录页面并在浏览器中查看生成的页面?

我想知道如何在http://www.deshabhimani.com/signin.php之类的页面上执行登录,该页面具有使用 python 的基于 php 的登录提示。此表单用于登录http://www.deshabhimani.com/epaper.php

该站点不提供 HTTP API。

我想稍后使用 python 下载电子纸的所有页面(它们是单独的),然后将其制成最终的一个文件 pdf。

我要下载的文件是http://www.deshabhimani.com/epaper.php?page=43210&ddate=27-07-2012&edition=Kochi只能通过登录访问

4

1 回答 1

8

那么首先检查页面代码,知道什么样的方法发送数据,以及用户名和密码名称。

<form action="signin.php" method="post" name="log_in" id="log_in" onsubmit="return login()">
                    <label for="name">User Name:</label><br>
                    <input type="text" maxlength="80" size="25" id="username" name="username" style="border:1px dotted #1a64a3; margin-bottom:10px">
                    <label for="email">Password:</label><br>
                    <input type="password" maxlength="80" size="25" id="password" name="password" style="border:1px dotted #1a64a3">
                    <input type="submit" name="submit" value="Login" style="background:url(images/submit.gif) no-repeat; width:59px; height:22px; color:#FFFFFF; padding-bottom:3px">
</form>

正如你从上面看到的,首先我们范围到表单,看看什么样的方法和文件的名称是什么

所以让我们在python中处理它

import urllib
login_data=urllib.urlencode({'username':'your username','password':'your password','submit':'Login'}) # replace username and password with filed name 
op = urllib.urlopen('www.exmaple.com/sign-in.php',login_data)
于 2012-07-27T09:57:57.180 回答