我想使用 perl 在 HTML 字符串中获取部分标记的所有内容。我正在使用以下代码行,但它似乎不起作用:
$article_content =~ s/^.*?<section>(.*)<\/section>.*?$/$1/;
我想使用 perl 在 HTML 字符串中获取部分标记的所有内容。我正在使用以下代码行,但它似乎不起作用:
$article_content =~ s/^.*?<section>(.*)<\/section>.*?$/$1/;
更改(.*)
并(.*?)
查看是否有帮助。
不要使用正则表达式来解析 HTML。您无法使用正则表达式可靠地解析 HTML。一旦 HTML 与您的期望发生变化,您的代码就会被破坏。有关如何使用 Perl 模块正确解析 HTML 的示例,请参阅http://htmlparsing.com/perl.html 。
第一个问题是您假设.
匹配任何字符,但只有在使用/s
.