我正在屏幕抓取的站点(我有信誉)最近更改了他们的服务器并阻止了端口 80。我以为我可以将端口 443 用于 https,但我现在收到超时错误。我只是创建一个新的 WWW::Mechanize 对象并使用 get() 来抓取网站。
我的问题是,既然他们使用 https,我是否需要添加 cookie?
这是添加饼干罐的正确方法吗?
my $agent = WWW::Mechanize->new();
$agent->agent('Mozilla/5.0 (X11; U; Linux x86_64; en-US; rv:1.9.2.3) Gecko/20100407 Ubuntu/9.10 (karmic) Firefox/3.6.3');
# we need cookies
$agent->cookie_jar(HTTP::Cookies->new);
这是错误:
正在尝试登录... 2010-04-22
14:00:08 发布
https://theURL/j_security_check时出错:
已超过登录过程允许的时间。如果您想继续,您必须单击两次并重新单击您请求的链接,或者关闭并重新打开您的浏览器 lib/mypackage.pm 第 40 行
这甚至是cookie问题吗?
有没有办法增加登录时间,即使我通过浏览器登录网站,感觉在我登录之前也需要 60 到 90 秒。