2

我想测试用户提交的内容以查看是否包含 HTML,并且我更愿意这样做而不必编写自己的正则表达式。有谁知道执行此操作的模块或在 perl 中执行此操作的好方法?

4

1 回答 1

2

您可以检查HTML::Restrict模块允许将内容限制为仅允许的标签。

例子:

use 5.012;
use strict;
use warnings;
use HTML::Restrict;
use Data::Dumper;

my @texts = map { { "has_html", 0, "text", $_ } }
            split(/==cut-here==/, do{ local $/; <DATA> });

my $res = HTML::Restrict->new();

foreach my $text (@texts) {
    my $tmp = $text->{text};
    my $plain = $res->process($tmp);
    $plain =~ s/\s//gs;
    $tmp =~ s/\s//gs;
    $text->{has_html} = $tmp cmp $plain ? "YES" : "NO";
}
say Dumper(\@texts);

__DATA__

    <img src="image.jpg" alt="tricky>text" />

    text with html
==cut-here==

plain

text here

==cut-here==again <!-- a > b --> with html==cut-here==
plain

将检查 4 块文本并检测 html。如果您配置,HTML::Restrict您也可以检查“允许”和“不允许”HTML 标签。

于 2013-05-16T18:11:03.060 回答