我有一个包含多个表的 HTML 文件(所有表都有相同的列数和相同的列名)。这些表格由其他 HTML 标记分隔。
对于每个表中的每一行,我想更改单元格 1 和单元格 3 的值。
这是我到目前为止所拥有的(感谢@depesz):
#!/usr/bin/env perl
use strict;
use warnings;
use utf8;
use open qw( :std :utf8 );
use HTML::TreeBuilder;
my $input_file_name = shift;
my $tree = HTML::TreeBuilder->new();
$tree->parse_file( $input_file_name ) or die "Cannot open or parse $input_file_name\n";
$tree->elementify();
my @tables = $tree->find_by_tag_name( 'table' );
for my $table (@tables) {
foreach my $row ($table->find_by_tag_name('tr')) {
foreach my $column ($table->find_by_tag_name('td')) {
# how do I change the text of first and 3rd column text to "removed"
}
}
}
print $tree->as_HTML();
exit;
它非常适合遍历 HTML 文件中的所有行。我只是不确定如何更改第 1 列和第 3 列中的文本。