0

所以我正在尝试创建一个类,它在三个不同的帧中读取 DNA 字符串——一个从位置 0(或第一个碱基)开始,另一个从位置 1(第二个碱基)开始,第三个开始读取在位置 2(第三个基地)。到目前为止,这是我一直在玩的:

def codons(self, frame_one, frame_two, frame_three):
        start = frame_one
        while start + 3 <=len(self.seq):
            yield (self.seq[start:start+3], start)
            start += 3

        start+1 = frame_two
        while start + 3 <=len(self.seq):
            yield (self.seq[start+1:start+4], start)
            start += 3

        start+2 = frame_three
        while start + 3 <=len(self.seq):
            yield (self.seq[start+2:start+5], start)
            start += 3

在这一点上,我认为这几乎是无稽之谈,但我已尽力而为。如果有人能给我一个关于我可以在这门课上从哪里开始纠正的想法,那就太好了。

4

1 回答 1

2

首先,您不能分配一些值并命名变量,例如start+1start+2等等。接下来,由于它与生物信息学有关,您可以将您的问题标记为生物信息学。此外,您将许多东西重复三遍,这对程序员来说太糟糕了。但是,您可以尝试使用以下代码段:

class Codons(object):

        def __init__(self, seq):
                self.seq = seq

        def codons(self, frame_one, frame_two, frame_three):

                while frame_one <=len(self.seq):
                    yield (self.seq[frame_one:frame_one+3])
                    frame_one += 3

                while frame_two <=len(self.seq):
                    yield (self.seq[frame_two:frame_two+3])
                    frame_two += 3

                while frame_three <=len(self.seq):
                    yield (self.seq[frame_three:frame_three+3])
                    frame_three += 3


test_codons = Codons("ATCGTG-")

val = test_codons.codons(0,1,2)

print("Codons are: ")
for i in val:
        print(i)

print("")

让我们知道它是否对您有用。干杯!!

于 2014-05-13T00:42:24.820 回答