14

例如,单词debacle会因为debac 起作用,但seabed不会起作用,因为:1. 任何 5 个字符的序列中都没有可以形成的 c,以及 2. 字母 e 出现两次。另一个例子,反馈会因为edbac 起作用。请记住,解决方案必须仅使用正则表达式来完成。

我尝试实施的一个策略是:如果第一个字母在 [ae] 内,则匹配它,并记住它。然后在 [ae] 中找到下一个字母,但不是第一个字母。等等。我不确定语法是什么(或者即使存在某些语法)所以我的代码不起作用:

open(DICT, "dictionary.txt");
@words = <DICT>;

foreach my $word(@words){

if ($word =~ /([a-e])([a-e^\1])([a-e^\1^\2])([a-e^\1^\2^\3])([a-e^\1^\2^\3^\4])/
){
    print $word;
}
}

我也在考虑使用 (?=regex) 和 \G 但我不确定它会如何工作。

4

3 回答 3

15
/
   (?= .{0,4}a )
   (?= .{0,4}b )
   (?= .{0,4}c )
   (?= .{0,4}d )
   (?= .{0,4}e )
/xs

它可能会导致更快的匹配以从所有组合中生成模式。

use Algorithm::Loops qw( NextPermute );
my @pats;
my @chars = 'a'..'e';
do { push @pats, quotemeta join '', @chars; } while NextPermute(@chars);
my $re = join '|', @pats;

abcde|abced|abdce|abdec|abecd|abedc|acbde|acbed|acdbe|acdeb|acebd|acedb|adbce|adbec|adcbe|adceb|adebc|adecb|aebcd|aebdc|aecbd|aecdb|aedbc|aedcb|bacde| baced|badce|badec|baecd|baedc|bcade|bcaed|bcdae|bcdea|bcead|bceda|bdace|bdaec|bdcae|bdcea|bdeac|bdeca|beacd|beadc|becad|becda|bedac|bedca|cabde|cabed| cadbe|cadeb|caebd|caedb|cbade|cbaed|cbdae|cbdea|cbead|cbeda|cdabe|cdaeb|cdbae|cdbea|cdeab|cdeba|ceabd|ceadb|cebad|cebda|cedab|cedba|dabce|dabec|dacbe| daceb|daebc|daecb|dbace|dbaec|dbcae|dbcea|dbeac|dbeca|dcabe|dcaeb|dcbae|dcbea|dceab|dceba|deabc|deacb|debac|debca|decab|decba|eabcd|eabdc|eacbd|eacdb| eadbc|eadcb|ebacd|ebadc|ebcad|ebcda|ebdac|ebdca|ecabd|ecadb|ecbad|ecbda|ecdab|ecdba|edabc|edacb|edbac|edbca|edcab|edcba

(这将在 Perl 5.10+ 中优化为 trie。在 5.10 之前,使用 Regexp::List。)

于 2012-06-21T17:40:05.590 回答
7

正如您发现的那样,您的解决方案很聪明,但不幸的[a-e^...]是不起作用。我不相信有一种方法可以混合常规和否定字符类。我可以想到一个使用前瞻的解决方法:

    /(([a-e])(?!\2)([a-e])(?!\2)(?!\3)([a-e])(?!\2)(?!\3)(?!\4])([a-e])(?!\2)(?!\3)(?!\4])(?!\5)([a-e]))/

在这里查看:http ://rubular.com/r/6pFrJe78b6 。

更新: Mob 在下面的评论中指出,可以使用交替来压缩上述内容:

    /(([a-e])(?!\2)([a-e])(?!\2|\3)([a-e])(?!\2|\3|\4])([a-e])(?!\2|\3|\4|\5)([a-e]))/

新演示:http ://rubular.com/r/UUS7mrz6Ze 。

于 2012-06-21T17:46:19.347 回答
6
#! perl -lw
for (qw(debacle seabed feedback)) {
    print if /([a-e])(?!\1)
        ([a-e])(?!\1)(?!\2)
        ([a-e])(?!\1)(?!\2)(?!\3)
        ([a-e])(?!\1)(?!\2)(?!\3)(?!\4)
        ([a-e])/x;
}
于 2012-06-21T17:44:33.273 回答