我阅读了许多问题和许多答案,但我找不到我的问题的直接答案。所有的答案要么非常笼统,要么与我想做的不同。到目前为止,我需要使用 HTML::TableExtract 或 HTML::TreeBuilder::XPath 但我不能真正使用它们来存储值。我可以以某种方式获取表格行值并使用 Dumper 显示它们。
像这样的东西:
foreach my $ts ($tree->table_states) {
foreach my $row ($ts->rows) {
push (@fir , (Dumper $row));
} }
print @sec;
但这并不是我真正想要的。我将添加要存储值的 HTML 表的结构:
<table><caption><b>Table 1 </b>bla bla bla</caption>
<tbody>
<tr>
<th ><p>Foo</p>
</th>
<td ><p>Bar</p>
</td>
</tr>
<tr>
<th ><p>Foo-1</p>
</th>
<td ><p>Bar-1</p>
</td>
</tr>
<tr>
<th ><p>Formula</p>
</th>
<td><p>Formula1-1</p>
<p>Formula1-2</p>
<p>Formula1-3</p>
<p>Formula1-4</p>
<p>Formula1-5</p>
</td>
</tr>
<tr>
<th><p>Foo-2</p>
</th>
<td ><p>Bar-2</p>
</td>
</tr>
<tr>
<th ><p>Foo-3</p>
</th>
<td ><p>Bar-3</p>
<p>Bar-3-1</p>
</td>
</tr>
</tbody>
</table>
如果我可以将行值成对存储在一起会很方便。
预期输出类似于一个数组,其值为: (Foo , Bar , Foo-1 , Bar-1 , Formula , Formula-1 Formula-2 Formula-3 Formula-4 Formula-5 , ....)对我来说是学习如何存储每个标签的值以及如何在标签树中移动。