我正在写一个网络爬虫,并且是 Perl 新手。我HTML::TreeBuilder
用来获取我需要的数据,但我遇到了一个我不知道如何处理的案例。这是一些示例 HTML:
<div class="anything" val="20" name="matchup">someUniqueData</div>
我想val
从这个 HTML 标记中提取。我一直在使用findvalues()
我的大部分工作,但我不知道这是否可以从内部标签中提取数据。我没有成功地掩盖了文档。这种刮擦有简单的解决方案吗?