目标:
制表符分隔的文件包含不同的字符串。有些元素是相同的,有些则不是。我想在同一行“连接”特定元素。但是,在此操作中,我需要对特定元素进行更改以将它们彼此分开,例如在末尾添加一个数字。
输入(在@input中):
File1 2 range-2 operation execute:error 12345444,294837,298774
File2 3 range-1 default range:error 349928,37224
...
我想将“字段”执行:错误与 12345444,294837,298774 和范围:错误与 349928,37224 连接起来,给出:
输出:
execute:error-1
12345444
execute:error-2
294837
execute:error-3
298774
range:error-1
349928
range:error-2
37224
PERL 代码:我正在考虑对@input 中的元素执行 foreach 循环,使用例如哈希来计算最后一个“列”中用逗号分隔的“字符串”的数量,并以某种方式添加一个数字(例如等于总哈希-1,做一个计数器?)。但是,这有点过头了。怎么样,我可以完成这个吗?我在下面尝试了一点,但在尝试阅读和搜索类似问题大约两个小时后就停止了。也许我不应该使用哈希?
my @output = ();
foreach (@input) {
our(@F) = split('\t', $_, 0);
my @end_numbers = split(',', $F[5], 0);
%count;
foreach (@end_numbers) {
++$count{$_};
my $counts = keys %count;
my $output = $F[4] . (adding a value here, e.g. $counts -1 for each loop itteration ) "\n" . $_;
push (@output, $output);
}
}
解决方案:根据@ikegami 的建议。
my @output = ();
my %counts = ();
foreach (@input) {
chomp $_;
my @fields = split(/\t/, $_, 0);
for my $num (split /,/, $fields[5]) {
++$counts{$fields[4]};
my $output = $fields[4] . "_" . $counts{$fields[4]} . "\n" . $num . "\n";
push (@output, $output);
}
}