我有 100 多个具有以下结构的 html 文件。
<html>
<head>
<body>
<TABLE>
...
</TABLE>
<TABLE>
<TR>
<td rowspan=2><img src="http://www.example.com" width=10></td>
<TD width=609 valign=top>
<!-- Content of file1 -->
<p>abc</p>
...
...
...
<p>xyz</p>
</TD>
</TR>
<TR>
<TD align="center" ...alt="top"></a></TD>
</TR>
</TABLE>
</body>
</html>
我想将每个文件的第二个表()中第一行的第 2 列中的内容合并到一个 HTML 中,TABLE[2]ROW[1]COLUMN[2]
以获得这样的输出
<html>
<head>
<body>
<!-- Content of file1 -->
<p>abc</p>
...
...
...
<p>xyz</p>
<!-- Content of file2 -->
<p>some text</p>
...
...
...
<p>some text</p>
..
..
..
<!-- Content of fileN -->
<p>some text</p>
...
...
...
<p>some text</p>
</body>
</html>
我是 perl 的新手,我请求一些帮助以指出我如何做到这一点。提前致谢。
下面开始为file1写一篇文章,但我不确定我是否以正确的方式进行。
use HTML::TableExtract;
open (my $html,"<","file1.html");
my $table = HTML::TableExtract->new(keep_html=>0, depth => 1, count => 2, br_translate => 0 );
$table->parse($html);
foreach my $row ($table->rows) {
print join("\t", @$row), "\n";
}