0

所以我有一个 DNA 序列文件,我的目标是用字母 M 随机替换序列中的 5 个核苷酸。

IE。dna1.txt 的序列为 ACTGGCTACATG。

我想让 ACMGGCTACATTG 看起来像 ACMMGCMMCATMG 或类似的东西。

我知道如何一次替换一个字母,但不是几个。

dna1 = open ("dna1.txt","r")
data1 = dna1.read()

from random import randint, choice

def Mutated_DNA(data1):
    dna_list = list(data1)
    mutation_site = randint(0, len(dna_list)-1)
    dna_list[mutation_site] = choice(list('M'))        
    return ''.join(dna_list) 

print (Mutated_DNA(data1))

我该怎么办?

4

1 回答 1

1

如果你想用新的东西准确地替换5 个字符,那么我认为最简单的方法是从可能的位置中取样,然后完全改变这些位置。例如:

from random import sample

def mutate(s, num, target):
    change_locs = set(sample(range(len(s)), num))
    changed = (target if i in change_locs else c for i,c in enumerate(s))
    return ''.join(changed)

例如

>>> mutate('ABC', 2, 'M')
'MMC'
>>> mutate('ABC', 2, 'M')
'AMM'
>>> mutate('ABC', 2, 'M')
'MMC'
>>> mutate('ABC', 2, 'M')
'MBM'

或者

def mutate(s, num, target):
    change_locs = sample(range(len(s)), num)
    new_s = list(s)
    for change_loc in change_locs:
        new_s[change_loc] = target
    return ''.join(new_s)

等等

于 2013-04-09T19:53:31.303 回答