非常感谢您花时间阅读本文。我对 Perl 还是很陌生,所以非常感谢任何帮助!
我正在尝试使用正则表达式从大量大型文档中提取一段文本。
我有一个正则表达式,我用它来识别我想要开始提取的较大文档中的哪个位置。这个正则表达式的条件是经常有多个匹配正则表达式的实例。我能够确定哪些匹配项是我要提取的文本正文的开头。(在下面的示例中,这将是 $finds[2]。
我想做的是再次运行相同的正则表达式,并添加 .*?$END 以提取 $END 标识结尾的文本。但是我需要一种方法来告诉正则表达式在 $STAR 的第 N 次出现时开始提取。
考虑一下:
my $sentence = 'A1Z blah blah A2Z blah blah A3Z blah A4Z END A5Z';
my @finds = $sentence =~ m/(A\dZ)/mg;
####################
## Code that determine the element of @finds that
## contains the match to the extraction I want.
## For this question assume it is the third match (A3Z),
## Element index number 2.
####################
$START = 2;
这是我的尝试:
my @finds2 = ($sentence =~ m/((A\dZ){$START}.*?(END))/mg);
my @finds2 = ($sentence =~ m/((A\dZ)[$START].*?(END))/mg);
如果 {$START} 或 [$START] 指示 PERL 等到它具有第“$START”匹配以开始提取并继续匹配,我希望它。
我知道我的尝试是不正确的。希望他们能帮助表明我正在尝试做什么。