我正在尝试使用 Python/URLLib2 登录论坛。但我似乎无法成功。我认为这可能是因为登录页面中有几个表单对象,而我提交了不正确的一个(相同的代码适用于不同的论坛,只有一个表单)。
有没有办法指定在 URLLib2 中提交哪个表单?
谢谢。
在这里,我可以为您提供实现目标的步骤:
使用 urllib2 读取页面
将页面解析为 dom 对象(参见 xml.dom.minidom.parsestring 或其他等效项)
通过搜索表单 ID 等来搜索页面是否具有登录表单。
如果表单存在,请使用代码创建表单单击(创建 http 标头、响应数据)。并使用 urllib2 http 方法(GET 或 POST 或用于 Ajax,带有w3c 学校记录的额外标头)发布信息
9000 说:“我会尝试嗅探/跟踪浏览器和网站之间的真实交换;Chrome 和 FF 都有相应的工具。我也会考虑使用 mechanize 而不是原始 urrlib2”
这就是答案——mechanize 真的很容易使用并且支持多种形式。
谢谢!