我正在寻找一种使用通配符搜索和替换的班轮解决方案。
输入:
>sequence1
ATGCCAAACTGGAACT[A/T]ATTCAATGGCATGGACATAAATTC[A/C]ATACAATTACAAA
>sequnce2
ATCAAACCGGTATGTACATT[A,T/G]ATTCATTACTA
输出:
>sequence1
ATGCCAAACTGGAACTNATTCAATGGCATGGACATAAATTCNATACAATTACAAA
>sequnce2
ATCAAACCGGTATGTACATTNATTCATTACTA
我需要用 "N" 替换 "[" 和 "]" 之间的所有内容。数据长度可能会有所不同。我能够使用 awk 脚本找到该模式,但不知道如何替换它。请帮忙..
awk -F'[][]' '{for(i=2;i<=NF;i=i+2) print $i}' 1.fasta
我尝试的另一件事是 vi 编辑器
:%s/[.*\]/N/g
使用以上一个,它将所有“[A/T]ATTCAATGGCATGGACATAAATTC[A/C]”替换为 N