2

在这两个版本的 perl(5.8.8 和 5.16.2)上运行以下脚本表明 5.16.2 比使用正则表达式操作的 5.8.8 慢。为什么呢 ?而且,有没有办法可以加快速度?

    use Time::HiRes 'time';

    for my $regex (
            q{^a$|^b$},
            q{^(a|b)$},
            q{(a|b)},
            q{^a$|^b$|^c$|^d$|^e$|^f$},
            q{^(a|b|c|d|e|f)$},
            q{a|b|c|d|e|f},
    ) {
            my $start = time();

            for my $i (1 .. 100_000) {
                    'SOMEBIGSTRINGHERE' =~ m{$regex};
            }

            my $runtime = time() - $start;
            printf("%50s: %f\n", $regex, $runtime);
    }

使用 perl 5.8.8 -

                  ^a$|^b$: 0.101017
                  ^(a|b)$: 0.017527
                    (a|b): 0.107669
  ^a$|^b$|^c$|^d$|^e$|^f$: 0.163687
          ^(a|b|c|d|e|f)$: 0.022244
              a|b|c|d|e|f: 0.171675

使用 perl 5.16.2 -

                   ^a$|^b$: 0.254984
                   ^(a|b)$: 0.031507
                     (a|b): 0.045713
   ^a$|^b$|^c$|^d$|^e$|^f$: 0.443303
           ^(a|b|c|d|e|f)$: 0.031506
               a|b|c|d|e|f: 0.043478
4

2 回答 2

4

正则表达式引擎速度变慢的主要原因是错误修复。即正确地做事比做错事要慢。

于 2013-05-29T06:03:50.647 回答
0

我确实在我的机器上测试了你的程序几次。每次运行都有不同的时间,个体差异有时大于版本之间的大多数差异。

我认为版本之间的差异微不足道。顺便说一句,您的比较显示以下排名:

较慢/较慢/较快/较慢/较慢/较快

对于 5.16.2 与 5.8.8

事实上,你做了 100,000 次几乎什么都没做。尝试:

use strict;
use warnings;
use Time::HiRes 'time';
my $str = 'SOMEBIGSTRINGHERE_ somebigstringhere ' x 10000;
for my $regex ( qr{^a$|^b$},
                qr{^(a|b)$},
                qr{(a|b)},
                qr{^a$|^b$|^c$|^d$|^e$|^f$},
                qr{^(a|b|c|d|e|f)$},
                qr{a|b|c|d|e|f} ) {
     my $start = time();
     for my $i (1 .. 100) {
        $str =~ /$regex/;
     }

     my $runtime = time() - $start;
     printf("%50s: %f\n", $regex, $runtime);
 }

现在您可以看到是否完全涉及正则表达式引擎(或立即离开)。

于 2013-05-29T16:17:07.783 回答