问题标签 [mechanicalsoup]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-3.5 - MechanicalSoup 未捕获所选数据
我正在尝试使用以下代码。但我得到了第一个选定日期的 5 倍相同数据。
获取不同表格的正确日期的任何想法,或者它是机械汤中的错误。
python - Python和MechanicalSoup:循环后变量null
我有一个问题,我不知道它是 python 问题还是 MechanicalSoup 的问题:
当我在循环后使用浏览器对象时,该对象为空。我稍后也收到此消息:
我正在使用 Python 3.4.3 和 MechanicalSoup 0.9。
python - 使用 Python MechanicalSoup 登录时出现 503 错误
我想在登录页面后面抓取一些信息,但我得到了 503
这就是我尝试使用mechanicalsoup 登录时发生的情况(与robobrowser 的结果相同):
我已经尝试了几个不同的 user_agents,我该如何解决这个问题?移动饼干?
python-3.x - mechanicalsoup : 使用 iso8859-1 字符集进行表单 POST
我正在使用 python3 和mechanicalsoup
我需要向期望Content-Type
包含charset=iso-8859-1
. 通过从常规浏览器提交表单并查看开发窗格中的 POST 请求标头,我注意到了预期的字符集。
这是我正在使用的代码:
在当前状态下,当我使用mechanicalsoup 提交表单时,我会在网页(<head>
包含<meta charset="utf-8">
)中查看结果,字符串显示如下:Nous en avons plus l'utilité
. 我想原因如上所述:mechanicalsoup 可能发送带有 UTF8 字符集而不是 iso-8859 的表单。
http-status-code-403 - 403 错误与机械汤
为什么我在尝试抓取 hacked.com 时会收到 403,我该如何绕过它?根据 doesitusecloudflare.com 的说法,没有 cloudflare 阻碍(http://www.doesitusecloudflare.com/?url=https%3A%2F%2Fhacked.com%2Fwp-login.php)robots.txt允许任何用户代理并且只禁止访问 wp-admin 登录。
html - MechanicalSoup 2 表单提交按钮,是否给第一个发挥作用的时间?
我想使用 MechanicalSoup 填写的在线 HTML 表单有 2 个提交按钮(所以 1 个表单有 2 个提交按钮)。第一个按钮(图片“Toevoegen”中的红色)是选择文件后上传照片。第二个按钮(未显示)提交完成的表单。我已经想出了如何使用 form.choose_submit() 函数来处理不同的按钮,所以这很好。
我现在的问题如下:
当我手动填写表格时,我注意到在选择文件并按下第一个(红色)按钮后,文件上传需要一些时间(1-2 秒)。当我现在使用机械汤填写表格时,在我(制作机械汤)填写其余部分之前,我是否必须包括这个时间(1-2 秒)才能上传照片(例如使用 time.sleep())表单并使用第二个提交按钮提交?或者表单会发现它必须先上传图片并在执行最终提交订单之前等待?所以这真的是一个时间问题,我必须协调两个按钮的正常运行......
我希望这个编辑能更清楚地说明问题。
感谢您的任何建议!
如果有帮助:这是我在第一个提交按钮的 HTML 表单中找到的:
forms - MechanicalSoup - 设置隐藏字段?
使用 MechanicalSoup,是否也必须为表单中的隐藏字段设置值?或者我们可以忽略它们吗?
这是他们在 HTML 表单中的代码:
python - Mechanicalsoup 没有让我登录
我正在尝试使用mechanicalsoup 登录一个站点,但是当我提交表单时,它让我保持在同一页面上。我为此做了很多研究,但找不到答案。
javascript - MechanicalSoup (python 3x) 可以处理网站中的 javascript 吗?
我可以成功登录并浏览网站,但是当我检查注销按钮时,它就像javascript:__doPostBack('ctl00$lnkBtnLogout','')
链接一样,follow_link()
对此不起作用(说:没有适配器)???有人能帮我吗?