2

我尝试在 Perl 5 版本 5.20 下编写一个子例程,它创建一个存储在数组中的大型目录列表。子例程将结果作为 arrayref 返回。为方便起见,我希望可以选择对结果进行排序。

#!/usr/bin/env perl
use v5.20;
use warnings;
use strict;
use File::Slurp qw(read_dir);
use Time::HiRes;

use feature qw(signatures);
no warnings 'once';
no warnings 'experimental';
no warnings 'experimental::signatures';

my $PATH='/net/dbfs/GRM-RS/Flight-Campaigns/2021-08-23.Ram-Head-i-22.SE-01/cam/MM010259/iiq/';


sub fsReadDir($base, $sort, $mode = 1) {
    $base    //= '.';         # Base path default is the current path
    $sort    //= 0;           # Flag for array sorting of the result 
    my @res=read_dir($base);
    if ($sort) {
       return [sort(@res)] if $mode == 1;
       if ($mode == 2)  {
           @res = sort(@res);
           return \@res;
       }
    } else {  
        return \@res;
    } 
}

sub testSorting($sort, $mode, $max = 1000) {
    my $start = [Time::HiRes::gettimeofday()];   
    my $count = 0;
    for my $ix (0..$max) {
        my $array = fsReadDir($PATH, $sort, $mode );
        $count = @$array;
    }
    my $end   = time();
    my $dif = Time::HiRes::tv_interval($start);
    print "SORT: $sort MODE: $mode COUNT: $count TIME: $dif s\n"
}

testSorting(0, 1);
testSorting(1, 1);
testSorting(1, 2);

结果

/usr/bin/env perl "test-array.pl"
SORT: 0 MODE: 1 COUNT: 14861 TIME: 6.882694 s
SORT: 1 MODE: 1 COUNT: 14861 TIME: 9.131504 s
SORT: 1 MODE: 2 COUNT: 14861 TIME: 8.622628 s

直接在return级别对数组进行排序的有效方法是什么?

4

1 回答 1

3

如果你坚持在语句本身中对排序业务进行排序return可以使用三元

return $sort ? [ sort @res ] : \@res;

在简单的情况下,这可能一切都很好而且很清楚。

但是,我发现先处理案例和选项然后返回结果更清楚

@res = sort @res if $sort;

if    ($mode == 1) { ... }   # modes given in the question do nearly the same,
elsif ($mode == 2) { ... }   # but imagine different processing based on value
...

return \@res;

此外,就地排序应该更有效率。

如果这与效率有关,那么您需要在实际情况下对不同的方法进行基准测试。一方面,它可能会通过读取一个大目录而被吹得一团糟,因为人们可能无法分辨出回报是如何准确构建的任何性能差异。

所以我会为了清楚起见,直到清楚地看到选择确实会影响性能。

于 2022-01-13T18:12:26.430 回答