我想要一个简单的 perl 脚本,它可以帮助我在对齐序列中估算缺失的核苷酸:例如,我的 old_file 包含以下对齐序列:
seq1
ATGTC
seq2
ATGTC
seq3
ATNNC
seq4
NNGTN
seq5
CTCTN
所以我现在想推断文件中的所有 N,并获得一个新文件,其中所有 N 都是根据特定位置的多数核苷酸推断出来的。我的 new_file 应该是这样的:
seq1
ATGTC
seq2
ATGTC
seq3
ATGTC
seq4
ATGTC
seq5
CTCTC
具有用法的脚本:“impute_missing_data.pl old_file new_file”或任何其他方法将对我有所帮助。谢谢你。