1

我有以下html-

<a href="http://address.com">John</a>: I really <b>love</b> <b>soccer</b>;

我想将它解析成一个 csv 我会

姓名 = 约翰

评论 = 我真的很喜欢足球。

关键词=爱,足球

在控制台应用程序中,非常感谢任何帮助。

4

2 回答 2

11

CPAN 上有很多 HTML 解析器,我最喜欢的是HTML::TreeBuilder::XPath

Text::CSV将帮助您从提取的数据中生成 CSV。

于 2011-09-06T12:18:22.970 回答
4

这是一个如何使用HTML::TreeBuilder进行解析的示例:

use HTML::TreeBuilder;

my $html = HTML::TreeBuilder->new_from_content(<<END_HTML);
<a href="http://address.com">John</a>: I really <b>love</b> <b>soccer</b>;
END_HTML

my $name     = $html->find('a')->as_text;               # "John"
my @keywords = map { $_->as_text } $html->find('b');    # "love", "soccer"
my $comment  = $html->as_text;                          # "John: I really love soccer; "

清理工作留作$comment练习。

于 2011-09-06T14:07:57.580 回答