1

我想编写一个脚本来登录并与网页交互,但不知道从哪里开始。我大概可以弄清楚 html 解析,但是我该如何处理登录部分呢?我打算使用 bash,因为这是我最了解的,但我愿意接受任何其他建议。我只是在寻找一些参考资料或链接来帮助我入门。我不确定密码是否存储在 cookie 中或诸如此类的东西中,那么我该如何评估这种情况呢?

谢谢,

4

3 回答 3

4

看一下cURL,它通常在 Linux/Unix 环境中可用,它允许您编写对网页的调用脚本,包括 POST 参数(例如用户名和密码),并允许您管理 cookie 存储,以便随后的调用(以获取站点内的不同页面)可以使用相同的 cookie(因此您的登录将在调用中保持不变)。

于 2010-02-05T21:39:58.253 回答
2

前段时间我在工作中做过类似的事情,我不得不登录一个页面并一遍又一遍地发布相同的数据......

看看这里。我使用 wget 是因为我没有让它与 curl 一起使用。

于 2010-02-05T23:30:20.847 回答
1

搜索此站点以获取屏幕抓取。由于您需要处理 cookie、javascript 和隐藏字段(视图状态!),它可能会变得很麻烦。通常您需要抓取登录页面以获取隐藏字段,然后发布到登录页面。玩得开心 :D

于 2010-02-05T21:41:39.263 回答