最近我正在根据我的登录帐户curl
从stackoverflow.com抓取推荐的问题列表。
目前,为了在 HTTP 请求中注册我的帐户信息,我将 headers+cookies(由我的浏览器显示)复制并粘贴到一个文件中,编写了一个curl
用于抓取数据的脚本。
但是,正如我注意到的那样,浏览器发送的Cookie
字段中的某些键,例如__utma
and __utmb
,会定期更改,因此我必须相应地更新脚本中的 cookie 值,否则,我将无法根据我的帐户信息。
就我而言,这个必要的更新确实很麻烦。
我的困惑是:1,为什么cookie字段(由浏览器发送)经常变化?这背后的原因是什么?2、有没有办法让CURL表现得像浏览器一样,这样它就可以像浏览器一样适应cookie?