我正在尝试使用 mechanize 从 metacriti* 网站上抓取一些数据,但我没有得到任何输出
这是我的带有 url 示例的代码:
my $metaURL = "http://www.metacriti*.com/game/pc/dota-2";
my $mech = WWW::Mechanize->new();
$mech->get($metaURL) or die "unable to get $metaURL";
my $tree = HTML::TreeBuilder::XPath->new;
$tree->parse($mech->content);
my @nodes = $tree->findnodes(q{//*[@id="main"]//a[contains(./@href, "user-reviews")]/span[@class="score_value"]});
print $_->string_value, "\n" foreach(@nodes); # text
@nodes
数组似乎是空的,我的 xpath 似乎很好,因为我在另一个工作脚本中使用相同的语法,我真的不知道这个有什么问题......
另外,由于这只是开始,也许您可以建议我另一种简单的方法来抓取/解析网站...如果有更好的方法:)
先感谢您