0

目标:

制表符分隔的文件包含不同的字符串。有些元素是相同的,有些则不是。我想在同一行“连接”特定元素。但是,在此操作中,我需要对特定元素进行更改以将它们彼此分开,例如在末尾添加一个数字。

输入(在@input中):

File1 2 range-2 operation execute:error 12345444,294837,298774
File2 3 range-1 default range:error 349928,37224
...

我想将“字段”执行:错误与 12345444,294837,298774 和范围:错误与 349928,37224 连接起来,给出:

输出:

execute:error-1
12345444
execute:error-2
294837
execute:error-3
298774
range:error-1
349928
range:error-2
37224

PERL 代码:我正在考虑对@input 中的元素执行 foreach 循环,使用例如哈希来计算最后一个“列”中用逗号分隔的“字符串”的数量,并以某种方式添加一个数字(例如等于总哈希-1,做一个计数器?)。但是,这有点过头了。怎么样,我可以完成这个吗?我在下面尝试了一点,但在尝试阅读和搜索类似问题大约两个小时后就停止了。也许我不应该使用哈希?

my @output = ();
foreach (@input) {
    our(@F) = split('\t', $_, 0);
    my @end_numbers = split(',', $F[5], 0);
    %count;
    foreach (@end_numbers) {
        ++$count{$_};
        my $counts = keys %count;
        my $output = $F[4] . (adding a value here, e.g. $counts -1 for each loop itteration ) "\n" . $_;
        push (@output, $output);
}
}

解决方案:根据@ikegami 的建议。

my @output = ();
my %counts = ();
foreach (@input) {
    chomp $_;
    my @fields = split(/\t/, $_, 0);
    for my $num (split /,/, $fields[5]) {
    ++$counts{$fields[4]};
    my $output = $fields[4] . "_" . $counts{$fields[4]} . "\n" . $num . "\n";
    push (@output, $output);
    }
}
4

2 回答 2

1

您尝试连接的值是$count{$_}.

my %counts;
while (<>) {
    chomp;
    my ($class, $nums) = ( split /\t/ )[4,5];

    for my $num (split /,/, $nums) {
       ++$counts{$class};
       print "$class-$counts{$class}\n";
       print "$num\n";
    }
}

或者保存一行:

       printf "%s-%s\n", $class, ++$counts{$class};
       printf "%s\n", $num;

如果您希望为每一行输入重置计数,my $count;请在外循环内部使用而不是my %counts;,并使用$count而不是$counts{$class}

于 2013-07-31T13:13:47.223 回答
-1

只需使用 map 函数将字符串$F[4].--$count."\n$_\n"添加到$F[5]spitted list中的每个数字

foreach (@input) {
    my @F = split(/\t/, $_, 0);
    my $count = 0;
    my @end_numbers = map { $F[4]. --$count .qq|\n$_\n| } split(/,/, $F[5], 0);
    print @end_numbers;
}
于 2013-07-31T14:45:33.423 回答