0

我还是 Unix 的新手,但是我很想学习它。我有 2 个文件,有些行有一些匹配的子字符串,我想将这些行连接成一行,而其他行保持不变。下面是一个例子。

文件 1(fasta 文件):

>292183
AGAGTTTGATCCTGGCTCAGGATGAACGCTAGCGACAGGCTTAACACATGCAAGTCGAGGGGCAGCGGGGAGGAAGCTTGCTTTCTCTGCCGGCGACCGG CGCACGGGTGAGT
>551166
GTCGAGCGGCGAACGGGTGAGTAACGCGTGGATTATCTGCCCCGAGGTGGGGGATAACCCGGGGAAACTCGGGCTAATACCGCATATGACCGTGAGGTCA AAGGGGGGTCGCA

文件 2:

292183  k__Bacteria
551166  k__Bacteria; p__Acidobacteria

所需的输出:

>292183 k__Bacteria
AGAGTTTGATCCTGGCTCAGGATGAACGCTAGCGACAGGCTTAACACATGCAAGTCGAGGGGCAGCGGGGAGGAAGCTTGCTTTCTCTGCCGGCGACCGG CGCACGGGTGAGT
>551166 k__Bacteria; p__Acidobacteria
GTCGAGCGGCGAACGGGTGAGTAACGCGTGGATTATCTGCCCCGAGGTGGGGGATAACCCGGGGAAACTCGGGCTAATACCGCATATGACCGTGAGGTCA AAGGGGGGTCGCA

我尝试为此使用 awk 和 perl,但我从未将它们放入一个文件中。

我感谢任何帮助,最好的问候,M

4

1 回答 1

0
sed 's/\([0-9]*\).*/s.\1.&./' File_2 | sed -f- File_1
于 2013-06-07T12:35:49.393 回答