1

关于如何在 Perl 中执行多行正则表达式有很多问题。他们中的大多数都提到了s使点匹配换行符的开关。但是,我想匹配一个确切的短语(所以,不是模式),我不知道换行符在哪里。所以问题是:你可以忽略换行符,而不是将它们与.?

MWE:

$pattern = "Match this exact phrase across newlines";

$text1 = "Match\nthis exact\nphrase across newlines";
$text2 = "Match this\nexact phra\nse across\nnewlines";

$text3 = "Keep any newlines\nMatch this exact\nphrase across newlines\noutside\nof the match";

$text1 =~ s/$pattern/replacement text/s;
$text2 =~ s/$pattern/replacement text/s;
$text3 =~ s/$pattern/replacement text/s;

print "$text1\n---\n$text2\n---\n$text3\n";

我可以在模式中放置点而不是空格 ( "Match.this.exact.phrase"),但这不适用于第二个示例。我可以删除所有换行符作为预处理,但我想保留不属于匹配项的换行符(如第三个示例所示)。

期望的输出:

replacement text
---
replacement text
---
Keep any newlines
replacement text
outside
of the match
4

4 回答 4

3

只需将文字空格替换为与空格或换行符匹配的字符类:

$pattern = "Match[ \n]this[ \n]exact[ \n]phrase[ \n]across[ \n]newlines";

或者,如果您想更宽松,请使用\sor\s+代替,因为\s也匹配换行符。

于 2016-05-24T13:56:11.363 回答
3

大多数时候,您将换行符视为空格。如果这就是你想做的,那么你所需要的就是

$text =~ s/\n/ /g;
$text =~ /\Q$text_to_find/    # or $text =~ /$regex_pattern_to_match/

然后有一次你想忽略它。如果这就是你想做的,那么你所需要的就是

$text =~ s/\n//g;
$text =~ /\Q$text_to_find/    # or $text =~ /$regex_pattern_to_match/

如果您要匹配正则表达式模式,那么两者都做几乎是不可能的。但是您似乎想要匹配文字文本,这样就开辟了一些可能性。

( my $pattern = $text_to_find )
   =~ s/(.)/ $1 eq " " ? "[ \\n]" : "\\n?" . quotemeta($1) /seg;
$pattern =~ s/^\\n\?//;
$text =~ /$pattern/
于 2016-05-24T14:38:03.243 回答
2

听起来您想更改“精确”模式以匹配任何地方的换行符,并且还允许换行符而不是空格。所以改变你的模式来这样做:

$pattern = "Match this exact phrase across newlines";
$pattern =~ s/\S\K\B/\n?/g;
$pattern =~ s/ /[ \n]/g;
于 2016-05-24T14:23:16.427 回答
1

它当然很丑,但它有效:

M\n?a\n?t\n?c\n?h\st\n?h\n?i\n?s\se\n?x\n?a\n?ct\sp\n?h\n?r\n?a\n?s\n?e\sa\n?c\n?r\n?o\n?s\n?s\sn\n?e\n?w\n?l\n?i\n?n\n?e\n?s

对于单词中的每一对字母,允许在它们之间使用换行符\n?。并将正则表达式中的每个空格替换为\s.

可能无法使用,但它可以完成工作;)

在 regex101 中查看

于 2016-05-24T14:20:47.267 回答