1

我有一个通过 itertools 创建序列的 fasta 文件的程序。

import itertools
input=['ARIMALTHNAEYSDSFTAL','ARIMFLTHNFEYSESFTAL','AHIMNPTENAEYHESFTAL','AHIMNPTENTEYWDSFTAL','AHIMNDTHNFEYHDSFTAL','AHIMNDTNNTEYWESFTAL','ARIMFDTENAEYHDSFTAL','AHIMADTNNTEYWDSFTAL','ARIMFLTENTEYHESFTAL']

l=len(input[0])

my_residues=[set() for _ in xrange(l)]
for h in input: 
    for i,x in enumerate(h): 
        my_residues[i].add(x)

my_residues=[list(x) for x in my_residues]
fo=open('autotest.fasta','w')
vals=[]
for x in itertools.product(*my_residues): 
    val = ''.join(x)
    vals.append('>'+'\n'+val)
    print val

with open('autotest.fasta','w') as fo:
    fo.write('\n'.join(vals))
fo.close()

该程序运行良好。这将提供名为 autotest.fasta 的输出文件,看起来像

>
AHIMAPTHNAEYHESFTAL
>
AHIMAPTHNAEYHDSFTAL
>
AHIMAPTHNAEYSESFTAL
>
AHIMAPTHNAEYSDSFTAL
>
AHIMAPTHNAEYWESFTAL
>
AHIMAPTHNAEYWDSFTAL
...

这里我想要的是命名序列,以便输出 autotest.fasta 看起来像

>00
AHIMAPTHNAEYHESFTAL
>01
AHIMAPTHNAEYHDSFTAL
>02
AHIMAPTHNAEYSESFTAL
>03
AHIMAPTHNAEYSDSFTAL
>04
AHIMAPTHNAEYWESFTAL
>05
AHIMAPTHNAEYWDSFTAL
...

这样它就可以应用于任何输入。

任何帮助,将不胜感激。谢谢你。

4

1 回答 1

2
vals=[]
counter=0
for x in itertools.product(*my_residues): 
    val = ''.join(x)
    vals.append('>%02d\n%s' % (counter, val))
    print val
    counter += 1
于 2013-03-20T05:54:23.947 回答