0

有一个网站有一个表格。我想自动化一个过程,我在表单中输入一些值并检查结果。我想扫描很多表单组合(这就是我不想手动执行此操作的原因)。不幸的是,由于大量使用 cookie,我无法使用 cURL 自动化它。

我想也许我可以使用真正的浏览器为我做一些自动化?我在考虑 phantomjs 和 selenium(到目前为止还没有使用过 selenium)。selenium 运行真正的浏览器吗?这会很好,因为真正的浏览器会处理所有的 cookie 内容。

简而言之:我会有一堆 python 字典来填写网站表单。填写表格后,我想扫描 HTML 以检索结果。之后,我会总结一切(这一步会很简单)。硒适合我的需要吗?你能推荐一些更好的吗?

4

1 回答 1

2

是的 selenium 是一个浏览器模拟器,当你运行它时它会打开一个实际的浏览器窗口

phantom-js 是一个用于 selenium 的无头 Web 工具包,它将在后台运行浏览器而不显示实际的浏览器窗口

如果您不能使用、urllib、请求或机械化,那么是的,您最好的方法是使用硒

对于 HTML 解析,我推荐BeautifulSoup,它非常易于使用,并且会获得您需要的所有信息

于 2013-10-13T22:45:33.440 回答