-2

我有一个包含三个表的 html 文件。但我只想提取三个表中的一个。我该怎么做呢?

4

2 回答 2

1

您可以使用已知Perl模块执行此操作,例如:

  • LWP
  • WWW::Mechanize
  • HTML::TreeBuilder
  • HTML::TreeBuilder::XPath

所有都在http://search.cpan.org

最后一个 Perl 模块非常有用,您可以使用Xpath如下表达式:

//table[0]/tr[3]/td[2]/text()

例如,从第一个打印td第三个中第二个元素的文本。trtable

于 2012-10-23T20:12:35.163 回答
0

提取部分 HTML 文档的一个很好的模块是HTML::Query.

它提供了一个类似 jQuery 的界面,用于选择要提取文档的哪个部分。

于 2012-10-23T20:19:42.197 回答