问题标签 [mechanize-python]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
833 浏览

python - 在 Python 中填写 Ajax 表单

我正在尝试使用 mechanize 模块填写 ajax 框的表单(只是我对这几种表单的术语),但它似乎不起作用。我不是网络程序员,但我知道 ajax 框会使用由浏览器处理的事件来更新自己的“onchange”。

Mechanize 似乎没有处理这个问题,在链接列表中(来自迭代器 Browser.links)我可以找到一个 url 'javascript:AjaxRetry();' 带有错误消息作为文本,它告诉我出了点问题。

这是我的代码:

机械化正确的模块来填写该 ajax 框的表格吗?

我无法将链接粘贴到该 ajax 框所在的页面,因为您必须登录才能看到该框。

0 投票
2 回答
7552 浏览

python - Python Mechanize 选择表单 FormNotFoundError

我想选择一个带有机械化的表格。这是我的代码:

表格的代码:

但我收到了这个错误:

0 投票
1 回答
665 浏览

python - Python Mechanize:会话已过期

尝试使用 mechanize 从 https asp 网站上抓取一些内容,看起来好像登录页面提交工作正常,因为我返回了 200。但是当我尝试打开一个大概使用登录后捕获的 cookie 的 url 时,我得到了重新回到登录页面,错误提示我的会话已过期。最后一次打印只是为了让我可以看到我被重定向了。

0 投票
1 回答
2553 浏览

python - Web Scraper:限制单个域上每分钟/小时的请求?

我正在与一位图书管理员合作,重新构建他所在组织的数码摄影档案。

我已经用MechanizeBeautifulSoup构建了一个 Python 机器人,可以从集合中提取大约 7000 个结构不良和轻微不正确/不完整的文档。数据将被格式化为一个电子表格,他可以用它来纠正它。现在我估计总共有 7500 个 HTTP 请求来构建搜索字典,然后收集数据,不计算我的代码中的错误和重做,随着项目的进展,还有更多。

我假设对我发出这些请求的速度有某种内置限制,即使没有,我也会给我的机器人延迟以礼貌地处理负担过重的 Web 服务器。我的问题(诚然不可能完全准确地回答),是关于在遇到内置速率限制之前我可以多快发出 HTTP 请求?

我不想公布我们正在抓取的域的 URL,但如果它是相关的,我会问我的朋友是否可以分享。

注意:我意识到这不是解决我们的问题(重组/组织数据库)的最佳方法,但我们正在构建一个概念验证来说服上级相信我的朋友拥有数据库的副本,他将从那里浏览必要的官僚机构,让我可以直接处理数据。

他们还为我们提供了用于 ATOM 提要的 API,但它需要一个关键字来搜索,并且对于逐步浏览特定集合中的每张照片的任务似乎无用。

0 投票
3 回答
21446 浏览

python - 如何从标头中的 Content-Disposition 获取文件名

我正在使用 Mechanize 下载一个文件,并且在响应标头中有一个字符串:

有没有一种快速的标准方法来获取该文件名值?我现在想到的是这样的:

但它看起来像一个快速'n'dirty的解决方案。

0 投票
1 回答
1461 浏览

python - 为什么 http 请求挂在我的 python 脚本中?

我的一个脚本在 XP 系统上完美运行,但确切的脚本挂在 2003 系统上。我总是使用 mechanize 来发送 http 请求,这里有一个例子:

我认为我的代码没有任何问题,但是每次针对特定 url 的某个 http POST 请求时,它都会挂在 2003 年的计算机上(仅在该 url 上)。这一切可能是什么原因,我应该如何调试?

顺便说一句,直到几个小时前,脚本都可以正常运行。并且没有更改任何设置。

0 投票
2 回答
1477 浏览

python - 使用 Python mechanize 在表单中选择选项的 ItemNotFoundError

这是表格:

我的python代码:

错误信息:

我的脚本只知道“2.1.2”变量,我如何使用“2.1.2”而不是“value2”来设置选择值?

0 投票
3 回答
1620 浏览

python - Python Mechanize 找不到 login.live.com 表单

我正在尝试登录 login.live.com,但 Mechanize 无法识别该页面上有一个表单。有没有人有什么建议?

这导致:

mechanize._mechanize.FormNotFoundError:没有匹配 nr 0 的表单

当该页面上明显有表格时。

0 投票
2 回答
429 浏览

python - 无法从文本文件中打印特定行

所以我目前有这段代码来读取一个如下所示的accounts.txt文件:

然后我有这个(感谢这里的成员)读取accounts.txt文件并将其拆分为用户名和密码,以便稍后打印。当我尝试使用此代码分开的用户名和密码打印第 1 行时:

它打印出这个:

(这些是我在文本文件中的三行,正确拆分,但是它打印所有行,并且只打印每行的第一个字母。)

我尝试了几种不同的方法,但都没有运气。有人知道该怎么做吗?

谢谢你的帮助。真的很感激。这是我第二天的编程,对于这么简单的问题,我深表歉意。

0 投票
1 回答
6715 浏览

python - 使用机械化提交表单(TypeError:ListControl,必须设置序列)

我正在尝试使用 mechanize 提交表单,但遇到错误(TypeError:ListControl,必须设置序列)在谷歌搜索一段时间并尝试了几种不同的解决方案后,我无法解决问题。我正在尝试提交所有字段。

通过 mechanize 获取的表单数据(对于 br.forms() 中的 f 打印:f)

我当前的代码

请您协助并检查我是否为表单选项使用了正确的语法。谢谢