7

我已经将用户输入的 DNA 代码(A,T,G,C)转换为 RNA 代码(A,U,G,C)。这很容易

RNA_Code=DNA_Code.replace('T','U')

现在我需要做的下一件事是将 RNA_Code 转换成它的互补链。这意味着我需要用 U 替换 A,用 A 替换 U,用 C 替换 G,用 G 替换 C,但都是同时进行的。

如果我说

RNA_Code.replace('A','U')
RNA_Code.replace('U','A')

它将所有的 As 转换为 Us,然后将所有的 Us 转换为 As,但我只剩下所有的 As。

我需要它接受类似的东西AUUUGCGGCAAA并将其转换为UAAACGCCGUUU.

关于如何完成这项工作的任何想法?(3.3)

4

4 回答 4

14

使用转换表:

RNA_compliment = {
    ord('A'): 'U', ord('U'): 'A',
    ord('G'): 'C', ord('C'): 'G'}

RNA_Code.translate(RNA_compliment)

str.translate()方法采用从代码点(数字)到替换字符的映射。该ord()函数为我们提供了给定字符的代码点,使构建地图变得容易。

演示:

>>> RNA_compliment = {ord('A'): 'U', ord('U'): 'A', ord('G'): 'C', ord('C'): 'G'}
>>> 'AUUUGCGGCAAA'.translate(RNA_compliment)
'UAAACGCCGUUU'
于 2013-05-01T17:12:06.813 回答
6

您可以使用映射字典:

In [1]: dic={"A":"U","U":"A","G":"C","C":"G"}

In [2]: strs="AUUUGCGGCAAA"

In [3]: "".join(dic[x] for x in strs)
Out[3]: 'UAAACGCCGUUU'
于 2013-05-01T17:13:26.043 回答
1

如果您还没有使用它,我建议您尝试一下Biopython。它具有处理生物数据的各种功能,包括一个非常酷的Seq对象。有一个reverse_complement()功能可以完全满足您的要求,还有更多您可能还没有想到的功能。看看吧,它是一个真正的节省时间。

>>> from Bio.Seq import Seq
>>> from Bio.Alphabet import generic_dna
>>> my_dna = Seq("AGTACACTGGT", generic_dna)
>>> my_dna
Seq('AGTACACTGGT', DNAAlphabet())
>>> my_dna.complement()
Seq('TCATGTGACCA', DNAAlphabet())
>>> my_dna.reverse_complement()
Seq('ACCAGTGTACT', DNAAlphabet())
于 2013-05-01T17:17:51.257 回答
1

我有一个简单的解决方案:

# get the sequence from the user:

dna_seq = input("Please enter your sequence here: ")

# make a for loop to read the seq one nucleotide at a time and add each one in a new variable

compliment = ""

for n in dna_seq:

    if n == "A":
        compliment = compliment + "T"
    elif n == "T":
        compliment = compliment + "A"
    elif n == "G":
        compliment = compliment + "C"
    elif n == "C":
        compliment = compliment + "G"

print(compliment)
于 2019-01-25T15:31:16.517 回答