0

如何用 sed 替换任何不是“A”、“C”、“G”、“T”、“N”的字符串?

例如我有以下数据:

>AFCCCCC 1
cagktgagtgataaggc
>AFCGH22 1
cagntgagtgstaaggc

我想删除不以'>'开头的不是[ACGTN]的每个字符

因此我希望得到这个输出:

 >AFCCCCC 1
 cagtgagtgataaggc
 >AFCGH22 1
 cagntgagtgtaaggc

请注意,我删除了第一个和第二个序列的“k”和“s”。

4

1 回答 1

2

试试这个:

sed '/^>/!s/[^ACGTN]//ig' input.txt
于 2012-07-06T00:07:00.383 回答