我正在尝试通过我的 perl 脚本解析 HTML 文件。我正在使用一个名为 HTML::TreeBuilder 的模块。
这是我到目前为止所拥有的:
use HTML::TreeBuilder;
my $tree = HTML::TreeBuilder->new;
$tree->parse_file("sample.html");
foreach my $anchor ($tree->find("p")) {
print $anchor->as_text, "\n";
}
它工作正常。我得到了< p>
标签内的所有东西。
示例.html 文件:
< td>Release Version:< /td>< td> 5134< /td>< /tr>
< tr class="d0">< td>Executed By:< /td>< td>spoddar< /td>< /tr>
< tr class="d1">< td> Duration:< /td>< td>0 Hrs 0 Mins 0 Secs < /td>< /tr>
< tr class="d0">< td>#TCs Executed:< /td>< td>1< /td>< /tr>
5134
当我通过发布版本时,我想被打印。以同样的方式spoddar
,当我通过 Execute By 时,我想被打印出来。这些不是 HTML 标签。但是有没有办法获得这个?