我正在尝试用 Perl 做一个简单的网络爬虫,但是很多网站都有加载的动态内容,例如,使用 javascript 函数:
$(document).ready(function() {
$("#blabla").load('blublu/bla.php');
});
因此,我正在尝试调整我已经拥有的网络爬虫(获取 HTML 内容)以“等待”这些脚本加载,然后才获取整个(和完整的)网站内容 (HTML)。
到目前为止,我发现有人说这可以通过 WWW::Mechanize、Mechanize::Mozilla、WWW::Mechanize::Firefox 来实现。
问题是,我对 Perl 编程和模块实现不是很好,所以我想知道是否有好心人愿意在这里发布一个简单的示例或教程,展示我所要求的如何完成!