python - 从 urllib2 中第一个站点的 onload 目标 url 获取 html 内容

Question

我正在尝试使用 urllib2 获取网站的 HTML 内容。该站点有一个正文onload 事件，该事件在此站点上提交表单，因此它会转到目标站点并呈现我需要的详细信息。

响应 = urllib2.urlopen('www.xyz.com?var=999-999')

www.xyz.com 包含一个发布到“www.abc.com”的表单，此操作值根据 url 'var=999-999' 中的内容而有所不同，这意味着如果 var 值更改为 '，操作值将更改888-888'

response.read()

这仍然给了我 "www.xyz.com" 的 html 内容，但我想要得到的操作 url。从最终页面获取 html 内容的任何建议？

提前致谢

score 1 · Accepted Answer

你必须弄清楚对第二页的调用，包括发送的参数，这样你就可以从你的 python 代码中自己调用，最好的方法是在打开谷歌浏览器页面检查器的情况下导航第一页，然后转到 POST 调用的网络选项卡将被捕获，您可以看到发送的参数和所有参数。然后从 urllib2 重新创建相同的 POST 调用。

1 回答 1