1

我正在做一个网络自动化项目。我需要能够提取页面、评估数据并能够与页面交互(例如登录、输入值和发布到站点。)作为登录的衍生产品,我认为我需要一些允许我在给定凭据的情况下保持登录状态(例如,存储凭据或 cookie。)

我已经使用 UrlLib & Requests 库来提取文件和页面本身。

我正在尝试为该任务确定最好的 Python 库。

任何建议将不胜感激。

谢谢你!

4

1 回答 1

1

@n1c9

如果您可以可靠地重新创建用于身份验证登录的 HTTP 请求并且速度很重要,那么用于发出这些 HTTP 请求的 urllib/requests 和用于解析 HTML 响应的 beautifulsoup 将是最好的。否则,Selenium 是您最幸运的地方。如果您想了解更多详情,请告诉我。

看起来硒是正确的答案。

于 2019-03-22T00:52:14.883 回答