linux - 如何将 file1 的每一列附加到 file2 的特定字段并创建一个新的输出文件？

Question

我想将文件 1 的每一列附加为文件 2 的第 4 列，并导出为具有文件 1 中的列号或类似于输出名称的新文件。

输入文件 1 和 2 具有相同的行数：

输入文件 1 有 N 列：

12 23 34  .....
33 34 23
67 09 34
45 67 34
65 76 44
64 33 96

输入文件 2 最初有 5 列

AA BB FF DD 6
AA CC HH NN 7
AA DD II RR 4
AA EE JJ PP 2
AA FF KK QQ 9
AA GG LL SS 8

例如，前 3 个输出文件如下所示：

输出文件 1（第 1 列）：

AA BB FF 12 DD 6
AA CC HH 33 NN 7
AA DD II 67 RR 4
AA EE JJ 45 PP 2
AA FF KK 65 QQ 9
AA GG LL 64 SS 8

输出文件 2（第 2 列）：

AA BB FF 23 DD 6
AA CC HH 34 NN 7
AA DD II 09 RR 4
AA EE JJ 67 PP 2
AA FF KK 76 QQ 9
AA GG LL 33 SS 8

输出文件 3（第 3 列）：

AA BB FF 34 DD 6
AA CC HH 23 NN 7
AA DD II 34 RR 4
AA EE JJ 34 PP 2
AA FF KK 44 QQ 9
AA GG LL 96 SS 8

新文件名可以是 file1、file2、file3...或 column1、column2、column3....或类似名称。请问我怎样才能做到这一点？（for循环、awk、粘贴等）

任何建议，将不胜感激。

score 3 · Accepted Answer

cut如果您的列是制表符分隔的，您可以轻松地从和中获利paste：

for i in {1..N} ; do  # Insert the real N here, or change to $(seq 1 $N)
    cut -f1-3 input2 | \
        paste - \
              <(cut -f$i input1) \
              <(cut -f4- input2) \
        > output$i
done

score 1 · Accepted Answer

你只需要这样的东西：

awk '
NR==FNR { hd=$1" "$2" "$3"; tl=$4" "$5; next }
{  for (i=1;i<=NF;i++) {
      print hd, $i, tl > "file" i
   }
}
' file2 file1

score 1 · Accepted Answer

此方法只处理每个文件一次，这在文件很大时很有帮助。但是，它确实需要将第一个文件存储在内存中：

awk '
    NR==1 {n=NF} 
    NR==FNR {
        for (i=1; i<=n; i++) 
            file1[i, FNR]=$i
        next
    }
    {
        for (i=1; i<=n; i++) {
            filename = "merged" i
            print $1, $2, $3, file1[i, FNR], $4, $5 >> filename
        }
    }
' file1 file2

linux - 如何将 file1 的每一列附加到 file2 的特定字段并创建一个新的输出文件？

3 回答 3

Related

Reference