4

我想使用 pythonic 方法替换字符串中的一些字符。

A -> T
C -> G
G -> C
T -> A

例子:

AAATCGATTGAT

将转变为

TTTAGCTAACTA

我做了什么:

def swap(string):
    string = re.sub('A', 'aux', string)
    string = re.sub('T', 'A', string)
    string = re.sub('aux', 'T', string)
    string = re.sub('C', 'aux', string)
    string = re.sub('G', 'C', string)
    string = re.sub('aux', 'G', string)

    return string

它工作得很好,但我正在寻找一种更 Pythonic 的方式来实现它。

4

2 回答 2

5

使用具有理解和的字典str.join

translateDict = {
  "A" : "T",
  "C" : "G",
  "G" : "C",
  "T" : "A"
}

s1 = "AAATCGATTGAT"
reconstructed = "".join(translateDict.get(s, s) for s in s1)

这里有活生生的例子

注意使用dict.get; 如果这封信不在字典中,我们就让它保持原样。

正如@bravosierra99 建议的那样,您也可以简单地使用str.translate

reconstructed = s1.translate(string.maketrans(translateDict))
于 2019-02-28T03:56:22.667 回答
2

这是一个重构目前接受的—— Chepner 删除的答案,只调用maketrans一次。

tt = str.maketrans({"A":"T", "C":"G", "G":"C", "T": "A"})
for s1 in "AGACAT", "TAGGAC", "ACTAGAA":
    print(s1.translate(tt))

也许还指出您可以将结果从 链接起来replace,尽管这仍然很笨拙且效率低下:

def acgtgca(s1):
    return s1.replace(
        "A", "\ue0fa").replace(
        "G", "\ue0fb").replace(
        "C", "G").replace(
        "T", "A").replace(
        "\ue0fb", "C").replace(
        "\ue0fa", "T")

这避免了使用“aux”作为特殊标记来支持 Unicode Private Use Area之外的两个任意字符。

但同样,该maketrans方法更简洁、更有效。

于 2019-02-28T05:15:30.357 回答