我想提取 HTML 页面中特定表格单元格中存在的一些文本。
现在,问题是,这个单元格存在于一个没有 ID/名称的表格标签中。
我正在使用 HTML::TreeBuilder::XPath 来使用 XPATH 表达式提取值。
HTML 内容如下所示:
<table border="0">
<tr>
<td>Some Text</td>
<td>The Text I want comes here</td>
</tr>
这就是我的 XPATH 表达式的样子:
@nodes=$tree->findnodes(q{//table[8]/tr/td[2]/text()});
print $_->string_value."\n" foreach(@nodes); # corrected, thanks mirod.
它不显示输出。
我已经使用了上面的 table[8],因为这是 HTML 页面中的八个 table 标记(假设索引从 1 开始)。
另外,我使用了 td[2] 因为我想要第二个 td 标签之间的 innerHTML。
谢谢。