0

我正在尝试将字符串中的密码子转换为氨基酸。

这是我目前拥有的:

def converteRNAmParaAminoacidos(rna):
    dicionario = {'uuu':'F', 'uuc':'F','uua':'L', 'uug':'L', 'cuu':'L', 'cuc':'L', 'cua':'L', 'cug':'L', 'auu':'I', 'auc':'I', 'aua':'I', 'aug':'M', 'guu':'V', 'guc':'V', 'gua':'V', 'gug':'V', 'ucu':'S', 'ucc':'S', 'uca':'S', 'ucg':'S', 'ccu':'P', 'ccc':'P', 'cca':'P', 'ccg':'P', 'acu':'T', 'acc':'T', 'aca':'T', 'acg':'T', 'gcu':'A', 'gcu':'A', 'gcc':'A', 'gca':'A', 'gcg':'A', 'uau':'T', 'uac':'T', 'uaa':'*', 'uag':'*', 'cau':'H', 'cac':'H', 'caa':'G', 'cag':'G', 'aau':'N', 'aac':'N', 'aaa':'K', 'aag':'K', 'gau':'D', 'gac':'D', 'gaa':'E', 'gag':'E', 'ugu':'C', 'ugc':'C', 'uga':'*', 'ugg':'W', 'cgu':'R', 'cgc':'R', 'cga':'R', 'cgg':'R', 'agu':'S', 'agc':'S', 'aga':'R', 'agg':'R', 'ggu':'G', 'ggc':'G', 'gga':'G', 'ggg':'G'}
    for i,j in dicionario.iteritems():
        aminoacidos=rna.replace(i,j)
    return aminoacidos

但是,它不起作用,它只会替换最后一个密码子。

4

4 回答 4

2

在 Python 中,该replace函数返回一个新字符串。您正在做的是获取原始字符串,进行替换并将结果存储为aminoacidos. 当您replace再次调用时,您不会保留先前迭代的结果,因为您replace再次调用原始的、未更改的字符串。

您需要aminoacidos像这样重复使用:

aminoacidos = rna

for tripleto, cambio in dicionario.iteritems():
    aminoacidos = aminoacidos.replace(tripleto, cambio)
return aminoacidos
于 2013-06-11T01:50:32.390 回答
2

在您的循环中,您不修改aminoacidos. 您只需在每次迭代时都重新设置它。

虽然替换看起来会起作用,但替换的顺序会有所不同。举ucuuuc个例子。如果你先替换ucu,你最终会得到Suuc. 但是,如果你cuu先找到,你会得到uLuc,这将破坏后续的替换。

相反,您应该以三个为一组对字符串进行迭代,并在字典中查找每个字符串:

# I'd choose a better variable name
dicionario = {'uuu':'F', 'uuc':'F','uua':'L', 'uug':'L', 'cuu':'L', 'cuc':'L', 'cua':'L', 'cug':'L', 'auu':'I', 'auc':'I', 'aua':'I', 'aug':'M', 'guu':'V', 'guc':'V', 'gua':'V', 'gug':'V', 'ucu':'S', 'ucc':'S', 'uca':'S', 'ucg':'S', 'ccu':'P', 'ccc':'P', 'cca':'P', 'ccg':'P', 'acu':'T', 'acc':'T', 'aca':'T', 'acg':'T', 'gcu':'A', 'gcu':'A', 'gcc':'A', 'gca':'A', 'gcg':'A', 'uau':'T', 'uac':'T', 'uaa':'*', 'uag':'*', 'cau':'H', 'cac':'H', 'caa':'G', 'cag':'G', 'aau':'N', 'aac':'N', 'aaa':'K', 'aag':'K', 'gau':'D', 'gac':'D', 'gaa':'E', 'gag':'E', 'ugu':'C', 'ugc':'C', 'uga':'*', 'ugg':'W', 'cgu':'R', 'cgc':'R', 'cga':'R', 'cgg':'R', 'agu':'S', 'agc':'S', 'aga':'R', 'agg':'R', 'ggu':'G', 'ggc':'G', 'gga':'G', 'ggg':'G'}

def converteRNAmParaAminoacidos(rna):
    aminoacidos = ''

    for i in range(0, len(rna), 3):
        aminoacidos += dicionario[rna[i:i + 3]]

    return aminoacidos

或更简洁地说:

def converteRNAmParaAminoacidos(rna):
    return ''.join([dicionario[rna[i:i + 3]] for i in range(0, len(rna), 3])
于 2013-06-11T01:51:42.070 回答
1

您可能还想查看内置的Template类,它基本上就是在做您想做的事情。

from string import Template
s = Template('$who likes $what')
s.substitute(who='tim', what='kung pao')
'tim likes kung pao'
d = {'who':'tom', 'what':'moo shoo'}
s.substute(d) #pass same keywords as a dictionay
'tom likes moo shoo'
于 2013-06-11T03:18:23.970 回答
0

您只保存对aminoacidos变量的最后替换。我更改了您的代码以替换rna字符串并将其设置为rna. 它应该工作。

def converteRNAmParaAminoacidos(rna):
    dicionario = {'uuu':'F', 'uuc':'F','uua':'L', 'uug':'L', 'cuu':'L', 'cuc':'L', 'cua':'L', 'cug':'L', 'auu':'I', 'auc':'I', 'aua':'I', 'aug':'M', 'guu':'V', 'guc':'V', 'gua':'V', 'gug':'V', 'ucu':'S', 'ucc':'S', 'uca':'S', 'ucg':'S', 'ccu':'P', 'ccc':'P', 'cca':'P', 'ccg':'P', 'acu':'T', 'acc':'T', 'aca':'T', 'acg':'T', 'gcu':'A', 'gcu':'A', 'gcc':'A', 'gca':'A', 'gcg':'A', 'uau':'T', 'uac':'T', 'uaa':'*', 'uag':'*', 'cau':'H', 'cac':'H', 'caa':'G', 'cag':'G', 'aau':'N', 'aac':'N', 'aaa':'K', 'aag':'K', 'gau':'D', 'gac':'D', 'gaa':'E', 'gag':'E', 'ugu':'C', 'ugc':'C', 'uga':'*', 'ugg':'W', 'cgu':'R', 'cgc':'R', 'cga':'R', 'cgg':'R', 'agu':'S', 'agc':'S', 'aga':'R', 'agg':'R', 'ggu':'G', 'ggc':'G', 'gga':'G', 'ggg':'G'}
    for i,j in dicionario.iteritems():
        rna = rna.replace(i, j)
    return rna
于 2013-06-11T01:50:15.080 回答