所以我WWW::Mechanize
用来抓取网站。它工作得很好,除非我请求一个网址,例如:
http://www.levi.com/
我被重定向到:
http://us.levi.com/home/index.jsp
对于我的脚本,我需要知道这个重定向发生了,以及我被重定向到的 url 是什么。反正有没有用WWW::Mechanize
or检测到这个,LWP
然后得到重定向的 url?谢谢!
所以我WWW::Mechanize
用来抓取网站。它工作得很好,除非我请求一个网址,例如:
http://www.levi.com/
我被重定向到:
http://us.levi.com/home/index.jsp
对于我的脚本,我需要知道这个重定向发生了,以及我被重定向到的 url 是什么。反正有没有用WWW::Mechanize
or检测到这个,LWP
然后得到重定向的 url?谢谢!
use strict;
use warnings;
use URI;
use WWW::Mechanize;
my $url = 'http://...';
my $mech = WWW::Mechanize->new(autocheck => 0);
$mech->max_redirect(0);
$mech->get($url);
my $status = $mech->status();
if (($status >= 300) && ($status < 400)) {
my $location = $mech->response()->header('Location');
if (defined $location) {
print "Redirected to $location\n";
$mech->get(URI->new_abs($location, $mech->base()));
}
}
如果状态码是3XX,那么您应该检查重定向 url 的响应标头。
您还可以通过检查redirects()
响应对象上的方法来到达相同的位置。
use strict;
use warnings;
use feature qw( say );
use WWW::Mechanize;
my $ua = WWW::Mechanize->new;
my $res = $ua->get('http://metacpan.org');
my @redirects = $res->redirects;
say 'request uri: ' . $redirects[-1]->request->uri;
say 'location header: ' . $redirects[-1]->header('Location');
印刷:
request uri: http://metacpan.org
location header: https://metacpan.org/
请参阅https://metacpan.org/pod/HTTP::Response# $r-%3Eredirects 请记住,不止一个重定向可能会将您带到您当前的位置。因此,您可能想要检查通过返回的每个响应redirects()
。