0

我正在尝试使用 Python/URLLib2 登录论坛。但我似乎无法成功。我认为这可能是因为登录页面中有几个表单对象,而我提交了不正确的一个(相同的代码适用于不同的论坛,只有一个表单)。

有没有办法指定在 URLLib2 中提交哪个表单?

谢谢。

4

2 回答 2

1

在这里,我可以为您提供实现目标的步骤:

  1. 使用 urllib2 读取页面

  2. 将页面解析为 dom 对象(参见 xml.dom.minidom.parsestring 或其他等效项)

  3. 通过搜索表单 ID 等来搜索页面是否具有登录表单。

  4. 如果表单存在,请使用代码创建表单单击(创建 http 标头、响应数据)。并使用 urllib2 http 方法(GET 或 POST 或用于 Ajax,带有w3c 学校记录的额外标头)发布信息

于 2013-05-06T06:14:45.727 回答
0

9000 说:“我会尝试嗅探/跟踪浏览器和网站之间的真实交换;Chrome 和 FF 都有相应的工具。我也会考虑使用 mechanize 而不是原始 urrlib2”

这就是答案——mechanize 真的很容易使用并且支持多种形式。

谢谢!

于 2013-05-06T11:01:35.077 回答