0

我正在尝试使用 urllib2 获取网站的 HTML 内容。该站点有一个正文onload 事件,该事件在此站点上提交表单,因此它会转到目标站点并呈现我需要的详细信息。

响应 = urllib2.urlopen('www.xyz.com?var=999-999')

www.xyz.com 包含一个发布到“www.abc.com”的表单,此操作值根据 url 'var=999-999' 中的内容而有所不同,这意味着如果 var 值更改为 ',操作值将更改888-888'

response.read()

这仍然给了我 "www.xyz.com" 的 html 内容,但我想要得到的操作 url。从最终页面获取 html 内容的任何建议?

提前致谢

4

1 回答 1

1

你必须弄清楚对第二页的调用,包括发送的参数,这样你就可以从你的 python 代码中自己调用,最好的方法是在打开谷歌浏览器页面检查器的情况下导航第一页,然后转到 POST 调用的网络选项卡将被捕获​​,您可以看到发送的参数和所有参数。然后从 urllib2 重新创建相同的 POST 调用。

于 2012-09-12T08:45:13.353 回答