我正在尝试从文件中的 DNA 序列中发现以 ASCII 编码的文本。
下面是我的代码:
首先是打开FASTA文件,set是一个变量。
with open("/home/<username>/python/progseq") as mydnaseq:
sequence = mydnaseq.read().replace('\n','')
第二位是将序列转换为二进制,并将字母 C 和 G/T 设为 1:
binarysequence = sequence.replace('A','0')
然后我拿了这个 loooooong 二进制序列,想把它变成 8 位:
for i in range(0,len(binarysequence),8):
binarysequence [i:i+8]
然后创建了这样的输出:
'00110100'
'00110010'
'01000110'
'00011000'
'0'
虽然我的输出要长得多,但我只包括了序列的最后四个。
想知道如何将其转换为字母。