-1

我在登录asp页面时遇到了一些问题。

这是我的代码:

#!/usr/bin/perl -w
use strict;
use warnings;
use WWW::Mechanize;
use LWP::Debug qw(+);
my $mech = WWW::Mechanize->new;
$mech->agent('User-Agent=Mozilla/4.0');
$mech->get( 'http://site.net/index.asp' );
$mech->submit_form(
    form_name => 'form',
    fields      => {
        xpto    => '123'
    }
);
my $app_content = $mech->content();
print "$app_content\n";

这就是我从终端得到的:

    <html>
    <head>
        <title>Anti Bot</title>
    </head>
    <body>
        <h1 style="color:red;">Bots are not allowed here</h1>
    </body>
</html>
4

1 回答 1

1

要么它检测到您的用户代理很奇怪(大多数不以“User-Agent =”开头),要么在通过浏览器正常提交期间设置(或删除)字段的表单中有 javascript。尝试在浏览器中填写登录表单并观察实际发布的内容(通过 Firebug 等),并更新您的脚本以匹配。或者,使用可以运行 javascript 的网络抓取库,例如WWW::Mechanize::Firefox

当然,我假设您有权这样做。有些人有充分的理由不想在他们的网站上安装机器人。

于 2013-10-07T12:08:57.493 回答