0

我用 Perl 构建了一个网络爬虫。

我在用

HTML::ContentExtractor

LWP::UserAgent 

HTML::LinkExtor

提取文本表单网页。

示例代码web cralwer perl的参考链接

问题:

问题是它没有从扩展名为.aspx. 它适用于其他网页。我无法弄清楚为什么这个爬虫在aspx页面上失败的问题。

4

1 回答 1

1

为了能够使用 JavaScript 访问网站进程,请使用WWW::Mechanize::Firefox

于 2014-04-25T07:04:44.140 回答