问题标签 [mechanize-python]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
599 浏览

python - 用 mechanize 刮 way2sms

我正在尝试通过抓取 way2sms.com 发送短信,但我无法使用 mechanize 登录 way2sms.com。

我正在使用以下代码提交登录表单。

提交表单后,再次收到登录页面。

0 投票
1 回答
1929 浏览

python - 如何在 Python Mechanize 中不使用代理

我目前正在使用 Python + Mechanize 从本地服务器检索页面。如您所见,代码使用“localhost”作为代理。该代理是 Fiddler2 调试代理的一个实例。这完全符合预期。这表明我的机器可以到达test_box。

但是,当我删除 browser.set_proxies 语句时,它停止工作。我收到一个错误<“urlopen错误[Errno 10061]无法建立连接,因为目标机器主动拒绝它>”。关键是我可以使用任何浏览器从我的机器上访问 test_box。这也表明可以从我的机器上访问 test_box。

我怀疑这与 Mechanize 试图猜测正确的代理设置有关。也就是说:我的浏览器配置为访问除 test_domain.com 之外的任何域的 Web 代理。所以我怀疑 mechanize 尝试使用 Web 代理,而它实际上不应该使用代理。

我如何告诉 mechanize 不要猜测任何代理设置,而是强制它尝试直接连接到 test_box?

0 投票
1 回答
1057 浏览

python - 提交带有机械化 HTTP 错误 500 的表单

这是我第一次使用 mechanize,我正在尝试使用 mechanize 填写表格

这是我的浏览器选项:

我用有效值填写表单并点击 br.submit() 但它给了我 HTTP:错误 500:内部服务器错误。我假设它检测到它是一个机器人或提交的东西?但我认为这就是 addheaders 应该处理的问题。

0 投票
5 回答
12665 浏览

python - 如何在python mechanize中设置cookie

向服务器发送请求后

我得到了包含 set-cookie 的响应标题

因为mechanize好像记不住cookie,所以想给br设置cookie。我该怎么做?

我不知道。请帮忙

0 投票
3 回答
3845 浏览

python - 处理来自 urllib2 的异常并在 Python 中进行机械化

我是使用异常处理的新手。我正在使用 mechanize 模块来抓取几个网站。我的程序经常失败,因为连接速度慢并且请求超时。我希望能够在每次尝试之间延迟 30 秒后重试网站(例如超时)最多 5 次。

我查看了这个stackoverflow 答案,可以看到如何处理各种异常。我也看到(虽然它看起来很笨拙)我如何将尝试/异常放在一个while循环中来控制5次尝试......但我不明白如何跳出循环,或者在连接时“继续”成功并且没有抛出异常。

我将不胜感激有关(1)如何在成功打开时跳出循环,以及(2)如何使整个块不那么笨拙/更优雅的建议。

0 投票
1 回答
1209 浏览

python - 带有下拉提交的 Python 机械化复选框

我有一个电子邮件客户端。我使用 python mechanize 检查了我需要做一些事情(移动、删除、鸡蛋)的电子邮件的“复选框”:

问题在于提交按钮,它是一个下拉菜单,如下所示:

如何选择删除并按下提交按钮?一个代码示例会很棒。谢谢。

0 投票
1 回答
746 浏览

facebook - 获取 Facebook 页面完整的公共照片流

只有一个类似的问题,没有得到回答。至少不适合我。Facebook上有公共页面,假设我想获取他们的照片流?他们的专辑图片?我看不到 Graph API 如何允许我访问,因为我无法获得访问令牌,如果我从浏览器浏览,未登录,我仍然可以看到此公共信息,那么我如何使用 AI 访问它。

顺便说一句,我尝试使用 python+mechanize 进行报废,但如果你得到常规的照片流,你只得到部分照片流,没有全部,其余的你需要滚动或知道如何构建与浏览器相同的请求正在建设,但令人惊讶的是,执行请求的 JS 被很好地混淆了......

有什么帮助吗?

0 投票
1 回答
3734 浏览

python - 使用 lxml 查找 div 中的所有链接

我正在编写一个工具,该工具需要收集网页上 div 内的所有 url,但该 div 之外没有 url。简化的页面看起来像这样:

当使用 Firebug 选择 div 并选择 XPath 时,我得到://*[@id="foo"]。到目前为止,一切都很好。但是,我一直在尝试查找 div foo 中的所有 url。请帮助我找到一种方法来提取由元素中的 href 定义的 url。

类似于我正在使用 w3schools 的示例代码:

感谢您的时间!

0 投票
1 回答
896 浏览

python - 机械化提交创建需要下载的动态苍蝇的表单

到目前为止,我有执行此操作的机械化代码:

这是我遇到问题的地方。我需要它做的是将响应(文件)写入本地文件。就 python 与文件系统交互而言,我一无所知。

提前致谢

编辑:这是我目前拥有的一些代码

如果重要的话;我正在运行 Mac OS X

0 投票
1 回答
1193 浏览

python - 如何使用 python mechanize 添加客户端证书

我是安全 HTTPS 服务器的客户端,该服务器已向我颁发了受密码保护的 .pfx 证书,以便每次都向其系统识别我的身份。使用我安装了证书的浏览器(显然只有 IE6 和以前的版本有效)我能够登录并上传我每天需要做的文件。现在我正在尝试编写一个 Python 脚本来完成相同的任务,但我不确定这种方式是否可行。

我正在尝试使用 python mechanize 库连接到服务器。使用 OpenSSL,我将 .pfx 文件分解为 .key 和 .cer PEM 文件。我将它们用作我的 python 脚本的证书。

这是我的代码片段

无论我尝试什么,都会引发各种 SSL 异常 .. 即 SSL_CTX_use_certificate_chain_file SSL_CTX_use_PrivateKey_file

谁能告诉我我可能做错了什么,或者这根本不是正确的方法。