0

我正在尝试使用 ruby​​ 抓取特定 URL 的源数据。首先,我使用Net::http.new创建 http 对象,然后使用http.post传递适当的登录数据。这按预期工作并使用适当的会话 cookie 进行响应。

登录后,将会话 cookie 数据添加到标题中,然后我尝试访问我想要抓取的特定页面。服务器以 302 请求响应不同子域上的 aspx URL,并附带一个查询字符串,即。sub.domain.com/path/blah.aspx?md5=jdj456bnn. 当我尝试使用与之前使用的相同技术加载该子域时,我遇到了一个未经授权的用户 302。有谁知道加载该重定位的正确方法,或者我在这里可能缺少什么?

4

1 回答 1

0

很可能在重定向期间设置了会话 cookie,但您的代码没有维护它。

net-http-cheat-sheet ”可能会展示如何处理它,或者,看看使用Mechanize,它将使用 cookie jar 为您管理它们。

于 2013-01-18T05:57:10.650 回答