我有一个包含三个表的 html 文件。但我只想提取三个表中的一个。我该怎么做呢?
2 回答
1
您可以使用已知Perl模块执行此操作,例如:
LWPWWW::MechanizeHTML::TreeBuilderHTML::TreeBuilder::XPath
最后一个 Perl 模块非常有用,您可以使用Xpath如下表达式:
//table[0]/tr[3]/td[2]/text()
例如,从第一个打印td第三个中第二个元素的文本。trtable
于 2012-10-23T20:12:35.163 回答
0
提取部分 HTML 文档的一个很好的模块是HTML::Query.
它提供了一个类似 jQuery 的界面,用于选择要提取文档的哪个部分。
于 2012-10-23T20:19:42.197 回答