我有一个包含三个表的 html 文件。但我只想提取三个表中的一个。我该怎么做呢?
问问题
160 次
2 回答
1
您可以使用已知Perl
模块执行此操作,例如:
LWP
WWW::Mechanize
HTML::TreeBuilder
HTML::TreeBuilder::XPath
最后一个 Perl 模块非常有用,您可以使用Xpath
如下表达式:
//table[0]/tr[3]/td[2]/text()
例如,从第一个打印td
第三个中第二个元素的文本。tr
table
于 2012-10-23T20:12:35.163 回答
0
提取部分 HTML 文档的一个很好的模块是HTML::Query
.
它提供了一个类似 jQuery 的界面,用于选择要提取文档的哪个部分。
于 2012-10-23T20:19:42.197 回答