python - 使用 scikit-bio write 写入多个 fasta 条目

Question

我正在尝试使用 scikit-bio 读取 FASTA 文件条目，然后如果满足某些要求，则将某些条目写回另一个文件。我遇到的问题是这些.write方法似乎打开和关闭一个文件，因此每个条目都会覆盖前一个。

In [39]: f = 'seqs.fna'
         seqs = skbio.io.read(f, format='fasta')
         for seq in seqs:
             if seq.metadata['id'] in ['47P50SDHBQ1PA_0', '4OZ9UI889OL5V_1', '2EC8VWHQD1LW5_2']:
                 print('True')
                 seq.write('foo.txt')

True
True

我希望在这种情况下会写入两个条目，foo.txt但只有最后一个条目存在。如何将符合我的标准的所有序列写入文件？

score 3 · Accepted Answer

写入同一个打开的文件，而不是指定文件路径：

with open('output.fna', 'w') as output_fh:
    for seq in skbio.io.read('seqs.fna', format='fasta'):
        if seq.metadata['id'] in ['47P50SDHBQ1PA_0', '4OZ9UI889OL5V_1', '2EC8VWHQD1LW5_2']:
            seq.write(output_fh)

或者，您可以使用skbio.io.write编写序列生成器：

def filtered_seqs():
    for seq in skbio.io.read('seqs.fna', format='fasta'):
        if seq.metadata['id'] in ['47P50SDHBQ1PA_0', '4OZ9UI889OL5V_1', '2EC8VWHQD1LW5_2']:
            yield seq

skbio.io.write(filtered_seqs(), format='fasta', into='output.fna')

python - 使用 scikit-bio write 写入多个 fasta 条目

1 回答 1

Related

Reference