问题标签 [mechanicalsoup]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
412 浏览

python-3.5 - MechanicalSoup 未捕获所选数据

我正在尝试使用以下代码。但我得到了第一个选定日期的 5 倍相同数据。

获取不同表格的正确日期的任何想法,或者它是机械汤中的错误。

0 投票
1 回答
87 浏览

python - Python和MechanicalSoup:循环后变量null

我有一个问题,我不知道它是 python 问题还是 MechanicalSoup 的问题:

当我在循环后使用浏览器对象时,该对象为空。我稍后也收到此消息:

我正在使用 Python 3.4.3 和 MechanicalSoup 0.9。

0 投票
2 回答
1029 浏览

python - 使用 Python MechanicalSoup 登录时出现 503 错误

我想在登录页面后面抓取一些信息,但我得到了 503

这就是我尝试使用mechanicalsoup 登录时发生的情况(与robobrowser 的结果相同):

我已经尝试了几个不同的 user_agents,我该如何解决这个问题?移动饼干?

0 投票
1 回答
586 浏览

python-3.x - mechanicalsoup : 使用 iso8859-1 字符集进行表单 POST

我正在使用 python3 和mechanicalsoup

我需要向期望Content-Type包含charset=iso-8859-1. 通过从常规浏览器提交表单并查看开发窗格中的 POST 请求标头,我注意到了预期的字符集。

这是我正在使用的代码:

在当前状态下,当我使用mechanicalsoup 提交表单时,我会在网页(<head>包含<meta charset="utf-8">)中查看结果,字符串显示如下:Nous en avons plus l'utilité. 我想原因如上所述:mechanicalsoup 可能发送带有 UTF8 字符集而不是 iso-8859 的表单。

0 投票
1 回答
1134 浏览

http-status-code-403 - 403 错误与机械汤

为什么我在尝试抓取 hacked.com 时会收到 403,我该如何绕过它?根据 doesitusecloudflare.com 的说法,没有 cloudflare 阻碍(http://www.doesitusecloudflare.com/?url=https%3A%2F%2Fhacked.com%2Fwp-login.php)robots.txt允许任何用户代理并且只禁止访问 wp-admin 登录。

0 投票
1 回答
2416 浏览

python - 机械汤 - 表格填充,使用棘手的 HTML 表格

我正在尝试使用机械汤自动为我填写并提交时间表。

这是表单的样子:

时间表表格

这是页面该部分的相关源代码:

我正在使用机械汤填写表格并提交。

我必须使用 new_control 函数添加新控件,因为当我通过启动浏览器进行检查时,TimeIn、TimeOut 框没有出现。

这段代码不起作用,我不知道为什么。我想也许我弄乱了我正在添加的控件的名称或类型(也许它与表单的实际输入类型和名称不匹配 - 我检查了一个 chrome 扩展名,但事实并非如此)因为会单击保存按钮,但测试值并没有真正注册。

查看

这是单击保存按钮之前浏览器的外观:

它不注册!

0 投票
1 回答
326 浏览

html - MechanicalSoup 2 表单提交按钮,是否给第一个发挥作用的时间?

我想使用 MechanicalSoup 填写的在线 HTML 表单有 2 个提交按钮(所以 1 个表单有 2 个提交按钮)。第一个按钮(图片“Toevoegen”中的红色)是选择文件后上传照片。在此处输入图像描述第二个按钮(未显示)提交完成的表单。我已经想出了如何使用 form.choose_submit() 函数来处理不同的按钮,所以这很好。

我现在的问题如下:

当我手动填写表格时,我注意到在选择文件并按下第一个(红色)按钮后,文件上传需要一些时间(1-2 秒)。当我现在使用机械汤填写表格时,在我(制作机械汤)填写其余部分之前,我是否必须包括这个时间(1-2 秒)才能上传照片(例如使用 time.sleep())表单并使用第二个提交按钮提交?或者表单会发现它必须先上传图片并在执行最终提交订单之前等待?所以这真的是一个时间问题,我必须协调两个按钮的正常运行......

我希望这个编辑能更清楚地说明问题。

感谢您的任何建议!

如果有帮助:这是我在第一个提交按钮的 HTML 表单中找到的:

0 投票
1 回答
195 浏览

forms - MechanicalSoup - 设置隐藏字段?

使用 MechanicalSoup,是否也必须为表单中的隐藏字段设置值?或者我们可以忽略它们吗?

这是他们在 HTML 表单中的代码:

0 投票
1 回答
241 浏览

python - Mechanicalsoup 没有让我登录

我正在尝试使用mechanicalsoup 登录一个站点,但是当我提交表单时,它让我保持在同一页面上。我为此做了很多研究,但找不到答案。

0 投票
1 回答
415 浏览

javascript - MechanicalSoup (python 3x) 可以处理网站中的 javascript 吗?

我可以成功登录并浏览网站,但是当我检查注销按钮时,它就像javascript:__doPostBack('ctl00$lnkBtnLogout','')链接一样,follow_link()对此不起作用(说:没有适配器)???有人能帮我吗?