我刚刚开始使用 Perl,并编写了一个简单的脚本来进行一些网络抓取。我正在使用 WWW::Mechanize 和 HTML::TreeBuilder 来完成大部分工作,但我遇到了一些麻烦。我有以下 HTML:
<table class="winsTable">
<thead>...</thead>
<tbody>
<tr>
<td class = "wins">15</td>
</tr>
</tbody>
</table>
我知道有一些模块可以从表中获取数据,但这是一个特例;并非我想要的所有数据都在表格中。所以,我尝试了:
my $tree = HTML::TreeBuilder->new_from_url( $url );
my @data = $tree->find('td class = "wins"');
却@data
空手而归。我知道这个方法可以在没有类名的情况下工作,因为我已经成功地用$tree->find('strong')
. 那么,有没有可以处理这种 HTML 语法的模块呢?我浏览了 HTML::TreeBuilder 文档并没有找到任何看起来的东西,但我可能是错的。