2

我为这个挑战写了一个解决方案。它成功地处理了给出的示例案例,但不是实际案例。

挑战:如果 DNA 串与其反向补码相等,则它是反向回文。例如,GCATGC 是一个反向回文,因为它的反向补码是 GCATGC。例如:

5'...GCATGC...3'

3'...CGTACG...5'

鉴于:

FASTA 格式中长度最多为 1 kbp 的 DNA 字符串。

返回:

长度在 4 到 12 之间的字符串中每个反向回文的位置和长度。您可以按任何顺序返回这些对。

样本数据集

>Rosalind_24 TCAATGCATGCGGGTCTATATGCAT

样本输出

4 6

5 4

6 6

7 4

17 4

18 4

20 6

21 4

对于示例,它有效。然而,它在实际样本中失败了。

实际数据集:

>Rosalind_7901 ATATAGTCGGCTGTCCAGGCAATCGCGAGATGGGGAACGACATCTTGGTACTTTACGGAT GCCAAGACTTAATATCTGGCCCGGATATGACCGCGAGCACCCCCTACTCGTCTGTCGGTT TCGGCCGGCATGACCTGTCCTCTTGATAATAGATATAAGTTGCCAACCGCACTATTTCAA GATCAGATGCCCCAAGGCACAAGGCACAGAAGAATCAGGTACTGAGCAAACAGCGCCCAT TTGTCAGCGCAACTCCGAGCGACAGGCACAAGTGGTAGTAACATCTGTAGTCTACGAGCG CGGGACCGATGTAAAAAGCAACGAGAGACGGGGCCGTCGATAGAAAAGCAATGGAGTCCA TATGGGCACGCTGAGCGTGCCTGTACTAATTTCTATGGGCTACTGGCACTAGGGGCTTAA GCCCTCGGTTACCGCGCTTTATGAATATAGTTTTCGTGCCAGGAGTGTCTTGTTTCGAGG AAGCGTGAGCTACACTTAGCACGTCCGGGCTTATTGGAAATTTGTTCAGTCTGTATGCTC CGCAATATCATGTCGGCGCTCATTCAATGTTGCGTGTAATTTAGACCTCTACTACAGCTG GGGTTGGAGCGGTCGGTAGTAAGACGTATGATTACGGTTTACATCCCGCCGGCGGACACG GAACGTGATTTTCAGCATTGTCCCATCGTAGGGATTGGGGCCCTAGTAGGTGTGGGTAGC ACGTTACATGAAGCTATCCAATGGCGTATATACTCCATCCCATCGGACTAGAAGATTTGA GGGACCCAGTCATAACTGGTGCAAAATTACGTTACAAAAGCCGAGGATACAGTATA

实际输出:

1 4 2 4 23 6 24 4 48 4 70 4 73 4 79 4 82 4 86 4 93 4 124 6 125 4 126 6 127 4 131 4 155 4 156 4 184 4 222 4 236 4 251 4 337 4 342 4 389 4 394 4 415 4 423 4 440 4 441 4 452 4 453 4 482 4 496 4 509 4 513 4 526 6 527 4 554 4 558 4 565 4 587 4 604 6 605 4 634 4 656 10 657 8 658 6 659 4 674 4 709 6 710 4 714 4 733 4 739 4 744 4 758 8 759 4 759 6 760 4 761 4 780 4 813 4 818 4 822 4 846 4

代码:

from string import maketrans
table=maketrans('ATCG','TAGC')

protein=open('rosalind_revp.txt','r').read()[14::].strip()

for i in range(len(protein)):
    for ii in range(2,7):
        if protein[i:i+ii]==protein[i+2*ii-1:i+ii-1:-1].translate(table):
            print str(i+1),str(2*ii)

(测试样品时,第 4 行是

protein=open('rosalind_revp.txt','r').read()[12::].strip()

我什至手动匹配了一堆位置-长度对,很遗憾地发现它们都工作得很好。我仍然不知道为什么结果不被接受。谁能让我知道我错在哪里?

4

1 回答 1

0

这是我的 github 链接,它有解决方案希望这有效 def reverse(l): t="" for i in range(len(l)): if(l[i]=='A'): t=t+'T' elif(l[i]=='T'): t=t+'A' elif(l[i]=='C'): t=t+'G' elif(l[i]=='G'): t=t+'C' return t def rev(d): return d[len(d)::-1] k=input() p=input() for i in range(len(p)): for j in range(4,14): if (p[i:i+j]==rev(reverse(p[i:i+j]))and i+j<=len(p)): print(i+1, end=" ") print(j)

https://github.com/jssssv007/stackexcahnge

于 2020-06-02T18:06:40.843 回答