问题标签 [mechanicalsoup]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

111 问题

0 投票

2 回答

11670 浏览

python - 通过 Python 登录网站 - 如何处理 CSRF？

我正在使用 Python 3 作为脚本，该脚本将监视网页上用户个人资料中的更新。这个站点的登录受到 CSRF 对策的保护，这是一件好事。但是，我无法让我的脚本登录到该站点。

我的方法使用mechanicalsoup：
/li>
我的方法使用robobrowser：
/li>

在这两种情况下，我都会得到一个 HTTP 状态403和一条消息说CSRF verification failed. Request aborted.

任何想法如何解决这一问题？
有问题的表单有一个包含 CSRF 令牌的隐藏输入。我猜mechanicalsoup也robobrowser将提交此输入。我对吗？还是我必须特殊对待？
我认为这两个包使用的会话将处理像 cookie 之类的所有内容。有什么我错过的吗？

2015-07-24T10:56:36.150

0 投票

0 回答

500 浏览

python - 什么是mechanicalsoup 中的Mechanize get_link 等价物？

我正在尝试编写一个代码来读取电影的名称，并尝试使用 python 3.0 从 IMDB 获取它的详细信息。我正在使用mechanicalsoup，但打开浏览器后无法获取电影的链接。在mechanize 中有一个名为get_link 和follow_link 的方法。在mechanicalsoup 中是否有任何等价物。代码如下。

在这里我得到了错误

请帮帮我。还建议在 python 中是否有更好的 html 解析器和更新的文档。

python mechanicalsoup

2016-04-02T21:22:17.300

0 投票

1 回答

1142 浏览

python - Python3：通过 MechanicalSoup 提交表单时没有任何反应

提交搜索表单后，我需要在网站上进行一些抓取。问题是当我通过浏览器执行此操作时，页面不会重新加载，也不会在任何地方重定向：结果显示在搜索表单下方，链接没有任何更改，尽管我可以在“新”页面中看到它们html。但是当我使用以下代码时，我看不到应该在响应中的“新”页面 html（提供的链接是我实际尝试使用的链接）：

我不明白我错过了什么。我宁愿不使用硒。有什么线索吗？

python forms web-scraping mechanicalsoup

2016-08-02T11:13:52.093

0 投票

0 回答

59 浏览

http - HTTP POST 请求指南

我需要更新此页面上的页码以及同一站点上的任何类似页码：http: //architects-register.org.uk/towns/Bedfordshire/Ampthill

页面中实现这一点的代码如下所示：

我是 http POST 请求的新手，不知道我需要做什么。

使用 python 3.5.2，安装了 mechanize 0.2.5（活动版本）和 mechanize0.2.6，但 Visual Studio 在尝试加载 mechanize 时抛出错误。因此，我安装了Mechanical Soup，但不知道如何处理它以实现我的目标。已经转了几个小时，所以任何帮助表示赞赏！

http post request mechanize mechanicalsoup

2016-08-21T20:58:11.110

0 投票

0 回答

349 浏览