python - 同时 .replace 功能

Question

我已经将用户输入的 DNA 代码(A,T,G,C)转换为 RNA 代码(A,U,G,C)。这很容易

RNA_Code=DNA_Code.replace('T','U')

现在我需要做的下一件事是将 RNA_Code 转换成它的互补链。这意味着我需要用 U 替换 A，用 A 替换 U，用 C 替换 G，用 G 替换 C，但都是同时进行的。

如果我说

RNA_Code.replace('A','U')
RNA_Code.replace('U','A')

它将所有的 As 转换为 Us，然后将所有的 Us 转换为 As，但我只剩下所有的 As。

我需要它接受类似的东西AUUUGCGGCAAA并将其转换为UAAACGCCGUUU.

关于如何完成这项工作的任何想法？（3.3）

score 14 · Accepted Answer

使用转换表：

RNA_compliment = {
    ord('A'): 'U', ord('U'): 'A',
    ord('G'): 'C', ord('C'): 'G'}

RNA_Code.translate(RNA_compliment)

该str.translate()方法采用从代码点（数字）到替换字符的映射。该ord()函数为我们提供了给定字符的代码点，使构建地图变得容易。

演示：

>>> RNA_compliment = {ord('A'): 'U', ord('U'): 'A', ord('G'): 'C', ord('C'): 'G'}
>>> 'AUUUGCGGCAAA'.translate(RNA_compliment)
'UAAACGCCGUUU'

score 6 · Accepted Answer

您可以使用映射字典：

In [1]: dic={"A":"U","U":"A","G":"C","C":"G"}

In [2]: strs="AUUUGCGGCAAA"

In [3]: "".join(dic[x] for x in strs)
Out[3]: 'UAAACGCCGUUU'

score 1 · Accepted Answer

如果您还没有使用它，我建议您尝试一下Biopython。它具有处理生物数据的各种功能，包括一个非常酷的Seq对象。有一个reverse_complement()功能可以完全满足您的要求，还有更多您可能还没有想到的功能。看看吧，它是一个真正的节省时间。

>>> from Bio.Seq import Seq
>>> from Bio.Alphabet import generic_dna
>>> my_dna = Seq("AGTACACTGGT", generic_dna)
>>> my_dna
Seq('AGTACACTGGT', DNAAlphabet())
>>> my_dna.complement()
Seq('TCATGTGACCA', DNAAlphabet())
>>> my_dna.reverse_complement()
Seq('ACCAGTGTACT', DNAAlphabet())

score 1 · Accepted Answer

我有一个简单的解决方案：

# get the sequence from the user:

dna_seq = input("Please enter your sequence here: ")

# make a for loop to read the seq one nucleotide at a time and add each one in a new variable

compliment = ""

for n in dna_seq:

    if n == "A":
        compliment = compliment + "T"
    elif n == "T":
        compliment = compliment + "A"
    elif n == "G":
        compliment = compliment + "C"
    elif n == "C":
        compliment = compliment + "G"

print(compliment)

python - 同时 .replace 功能

4 回答 4

Related

Reference