我需要根据表的内容删除某些表。我解析了HTML::Tree
用于构建 HTML 树的 HTML。
我曾经replace_with_content
删除表格,但这只会删除表格标签并留下表格的内容。
请注意,表格是嵌套的。
my $content = get($url);
my $tree = HTML::Tree->new();
$tree->parse($content);
my (@table_tags) = $tree->look_down( '_tag' , 'table' );
my $string = $table_tags[0]->as_HTML;
my $tree2 = HTML::Tree->new();
$tree2->parse($string);
my (@table_tags2) = $tree2->look_down( '_tag' , 'table' );
$table_tags2[3]->replace_with_content();