perl - 这个 HTML::Parser() 代码在 Perl 中做了什么？

Question

我遇到了一个使用 HTML Parser 的 Perl 代码，如下所示

my $p = HTML::Parser->new(text_h => [ sub {$text .= shift}, 
                                  'dtext']);

请帮助我理解这一点。

score 2 · Accepted Answer

从文档中：

$p = HTML::Parser->new(api_version => 3,
                       text_h => [ sub {...}, "dtext" ]);

这将创建一个带有文本事件处理程序子例程的新解析器对象，该子例程接收具有解码的一般实体的原始文本。

编辑：

use HTML::Parser;
use LWP::Simple;
my $html = get "http://perltraining.stonehenge.com";
HTML::Parser->new(text_h => [\my @accum, "text"])->parse($html);
print map $_->[0], @accum;

其他

#!/usr/bin/perl -w
use strict;
use HTML::Parser;
my $text;
my $p = HTML::Parser->new(text_h => [ sub {$text .= shift}, 
                                     'dtext']);
$p->parse_file('test.html');
print $text;

其中，当在这样的文件上使用时：

<html>
<head>
<title>Test</title>
</head>
<body>
<h1>Test Stuff</h1>
<p>This is a test</p>
<ul>
<li>this</li>
<li>is a</li>
<li>list</li>
</ul>
</body>
</html>

产生以下输出：

Test


Test Stuff
This is a test

this
is a
list

这有帮助吗？

perl - 这个 HTML::Parser() 代码在 Perl 中做了什么？

1 回答 1

Related

Reference