3

我正在编写一个 perl 脚本,它审核一个库并将已安装软件的列表与另一台机器的列表进行比较,以确保它们使用相同的东西。我已经获取了原始数据并将其放入两个大小为二维的数组中,Nx4其中 N 是软件标题的数量。例如:

[Fileset1], [1.0.2.3], [COMMITTED], [Description of file]
[Fileset2], [2.4.2.2], [COMMITTED], [Description of a different file]
....

我现在需要比较这两个列表以找出差异,它们是否缺少级别差异的文件。还不是 perl 专业人士,我能想到的唯一方法是将第一个数组的每个元素与另一个数组的每个元素进行比较,以首先查找具有不同级别的匹配文件集或根本没有匹配的文件集。我必须用另一个列表重复这个过程,以确保我找到了所有可能的差异。显然,通过这个程序,我正在寻找大于 n^2 的效率。我想知道在比较超过 20,000 个条目的库时,是否有一些grep我可以使用的应用程序或类似的东西来避免这种情况。

简而言之,我需要比较两个二维数组并跟踪每个列表的差异,而不是仅仅找到两者的交集。

在此先感谢您的帮助!

4

1 回答 1

3

输出有点笨拙,但我喜欢这样Data::Diff的任务:

use Data::Diff 'Diff';
use Data::Dumper;

@a = ( ["Fileset1", "1.0.2.3", "COMMITTED", "Description of file" ],
       ["Fileset2", "2.4.2.2", "COMMITTED", "Description of a different file" ],
       ["Fileset3", "1.2.3.4", "COMMITTED", "Description of a different file" ] );

@b = ( ["Fileset1", "1.0.2.3", "COMMITTED", "Description of file" ],
       ["Fileset2", "2.4.2.99", "COMMITTED", "Description of a different file" ] );    

$out = Diff(\@a,\@b);    
print Dumper($out);

结果:

$VAR1 = {
  'diff' => [
    {
      'uniq_a' => [
        '2.4.2.2'
      ],
      'same' => [
        {
          'same' => 'COMMITTED',
          'type' => ''
        },
        {
          'same' => 'Description of a different file',
          'type' => ''
        },
        {
          'same' => 'Fileset2',
          'type' => ''
        }
      ],
      'type' => 'ARRAY',
      'uniq_b' => [
        '2.4.2.99'
      ]
    }
  ],
  'uniq_a' => [
    [
      'Fileset3',
      '1.2.3.4',
      'COMMITTED',
      'Description of a different file'
    ]
  ],
  'same' => [
    {
      'same' => [
        {
          'same' => '1.0.2.3',
          'type' => ''
        },
        {
          'same' => 'COMMITTED',
          'type' => ''
        },
        {
          'same' => 'Description of file',
          'type' => ''
        },
        {
          'same' => 'Fileset1',
          'type' => ''
        }
      ],
      'type' => 'ARRAY'
    }
  ],
  'type' => 'ARRAY'
};
于 2013-01-09T22:13:24.083 回答