我有一个通过 itertools 创建序列的 fasta 文件的程序。
import itertools
input=['ARIMALTHNAEYSDSFTAL','ARIMFLTHNFEYSESFTAL','AHIMNPTENAEYHESFTAL','AHIMNPTENTEYWDSFTAL','AHIMNDTHNFEYHDSFTAL','AHIMNDTNNTEYWESFTAL','ARIMFDTENAEYHDSFTAL','AHIMADTNNTEYWDSFTAL','ARIMFLTENTEYHESFTAL']
l=len(input[0])
my_residues=[set() for _ in xrange(l)]
for h in input:
for i,x in enumerate(h):
my_residues[i].add(x)
my_residues=[list(x) for x in my_residues]
fo=open('autotest.fasta','w')
vals=[]
for x in itertools.product(*my_residues):
val = ''.join(x)
vals.append('>'+'\n'+val)
print val
with open('autotest.fasta','w') as fo:
fo.write('\n'.join(vals))
fo.close()
该程序运行良好。这将提供名为 autotest.fasta 的输出文件,看起来像
>
AHIMAPTHNAEYHESFTAL
>
AHIMAPTHNAEYHDSFTAL
>
AHIMAPTHNAEYSESFTAL
>
AHIMAPTHNAEYSDSFTAL
>
AHIMAPTHNAEYWESFTAL
>
AHIMAPTHNAEYWDSFTAL
...
这里我想要的是命名序列,以便输出 autotest.fasta 看起来像
>00
AHIMAPTHNAEYHESFTAL
>01
AHIMAPTHNAEYHDSFTAL
>02
AHIMAPTHNAEYSESFTAL
>03
AHIMAPTHNAEYSDSFTAL
>04
AHIMAPTHNAEYWESFTAL
>05
AHIMAPTHNAEYWDSFTAL
...
这样它就可以应用于任何输入。
任何帮助,将不胜感激。谢谢你。