我正在尝试使用 WWW::Mechanize::Firefox 抓取内部站点上的所有链接。该站点通过 javascript 加载一些内容,因此我必须首先单击同一类“扩展”的某些元素。网站的结构是这样的:
<table>
<tr>
<td>
<a id="xyz" href="somesite"> Content </a>
</td>
</tr>
<tr>
<td>
<div>
<a id="twistie" onclick="expand_this">
<img class="expand" border="0" width="13" height="13" alt="Show All" title="Show All" src="images/plus.gif">
</a>
</div>
</td>
</tr>
</table>
单击图像会在 div 容器中加载更多内容。在网站上,有多个此类扩展图像,我必须全部单击它们才能访问所有内容。这是我失败的地方。
到目前为止我已经尝试过:
$mech->click( { xpath => '//img[@class="expand"]', synchronize => 0 } );
这仅单击第一个图像元素。
my @images = $mech->xpath( '//img[@class="expand"]', synchronize => 0 );
返回尽可能多的数组元素,我可以在我的页面上手动计数。但是,我对如何将返回的数组元素插入到点击动作中有点迷茫。
我可以打开第一个元素
$mech->click( { xpath => '//img[@class="expand"][0]', synchronize => 0 } );
但
$mech->click( { xpath => '//img[@class="expand"][1]', synchronize => 0 } );
还给我
No elements found for //img[@class="expand"][1] at (eval 1377)[/usr/share/perl/5.18/perl5db.pl:732] line 2.
我进一步尝试了这种方法:
foreach my $id ( 0 .. scalar @images ) {
print $id, "\n";
$mech->click( { xpath => qq(//img[\@class="expand"]["$id"]), synchronize => 0 });
}
但这并没有打开任何元素(不知道为什么)。
我在这里错过了什么吗?我需要做什么才能单击共享类的所有 img-tags,因为不幸的是图像错过了一个 id?