我想编写一个脚本来登录并与网页交互,但不知道从哪里开始。我大概可以弄清楚 html 解析,但是我该如何处理登录部分呢?我打算使用 bash,因为这是我最了解的,但我愿意接受任何其他建议。我只是在寻找一些参考资料或链接来帮助我入门。我不确定密码是否存储在 cookie 中或诸如此类的东西中,那么我该如何评估这种情况呢?
谢谢,
担
我想编写一个脚本来登录并与网页交互,但不知道从哪里开始。我大概可以弄清楚 html 解析,但是我该如何处理登录部分呢?我打算使用 bash,因为这是我最了解的,但我愿意接受任何其他建议。我只是在寻找一些参考资料或链接来帮助我入门。我不确定密码是否存储在 cookie 中或诸如此类的东西中,那么我该如何评估这种情况呢?
谢谢,
担
看一下cURL,它通常在 Linux/Unix 环境中可用,它允许您编写对网页的调用脚本,包括 POST 参数(例如用户名和密码),并允许您管理 cookie 存储,以便随后的调用(以获取站点内的不同页面)可以使用相同的 cookie(因此您的登录将在调用中保持不变)。
前段时间我在工作中做过类似的事情,我不得不登录一个页面并一遍又一遍地发布相同的数据......
看看这里。我使用 wget 是因为我没有让它与 curl 一起使用。
搜索此站点以获取屏幕抓取。由于您需要处理 cookie、javascript 和隐藏字段(视图状态!),它可能会变得很麻烦。通常您需要抓取登录页面以获取隐藏字段,然后发布到登录页面。玩得开心 :D