好的,所以我需要使用 python(biopython, http: //biopython.org/DIST/docs/tutorial/Tutorial.html )从 FASTA 文件中提取部分序列
我需要从每个序列中获取前 10 个碱基并将它们放在一个文件中,保留 FASTA 格式的序列信息。最糟糕的是,如果没有办法保留序列信息,我可以只使用碱基。所以这里有一个例子:
>gi|2765658|emb|Z78533.1|CIZ78533 C.irapeanum 5.8S rRNA gene and ITS1 and ITS2 DNA
CGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTGATGAGACCGTGGAATAAACGATCGAGTG
AATCCGGAGGACCGGTGTACTCAGCTCACCGGGGGCATTGCTCCCGTGGTGACCCTGATTTGTTGTTGGG
>gi|2765658|emb|Z78533.1|CIZ78533 C.irapeanum 5.8S rRNA gene and ITS1 and ITS2 DNA
CGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTGATGAGACCGTGGAATAAACGATCGAGTG
AATCCGGAGGACCGGTGTACTCAGCTCACCGGGGGCATTGCTCCCGTGGTGACCCTGATTTGTTGTTGGG
>gi|2765658|emb|Z78533.1|CIZ78533 C.irapeanum 5.8S rRNA gene and ITS1 and ITS2 DNA
CGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTGATGAGACCGTGGAATAAACGATCGAGTG
AATCCGGAGGACCGGTGTACTCAGCTCACCGGGGGCATTGCTCCCGTGGTGACCCTGATTTGTTGTTGGG
我需要一些方法来获得前 10 个基地(然后我计划在最后 10 个基地再做一次)。该教程网站非常详尽,但我对此并不陌生,因为它没有涉及到这个,我什至不确定它是否可能。谢谢你提供的所有帮助。