1

我正在编写一个从文件接收输入的程序,每一行可能包含“ATG”或“GTG”,我很确定我已经完成了我想做的所有事情。这是我第一次在 python 中使用生成器,在研究了这个问题之后,我仍然不知道为什么我会停止迭代。为此,我的生成器必须生成一个元组,其中包含在每个字符串中找到的 ATG 或 GTG 的起始位置。

import sys

import p3mod


gen = p3mod.find_start_positions()
gen.send(None)   # prime the generator

with open(sys.argv[1]) as f:
    for line in f:
        (seqid,seq) = line.strip().lower().split()
        slocs = gen.send(seq)
        print(seqid,slocs,"\n")

gen.close()  ## added to be more official

这是发电机

def find_start_positions (DNAstr = ""):

    DNAstr = DNAstr.upper()

    retVal = ()
    x = 0
    loc = -1

    locations = []

    while (x + 3) < len(DNAstr):

        if (DNAst[x:x+3] is "ATG" or DNAstr[x:x+3] is "GTG" ):
            loc = x

        if loc is not -1:
            locations.append(loc)

        loc = -1

    yield (tuple(locations))

这是错误:

Traceback (most recent call last):
  File "p3rmb.py", line 12, in <module>
    slocs = gen.send(seq)
StopIteration
4

4 回答 4

2

您制作了一个可以一次返回所有数据的生成器。您应该在每次迭代中产生数据。此代码可能并不完美,但它可能会解决您的部分问题:

def find_start_positions (DNAstr = ""):
    DNAstr = DNAstr.upper()

    x = 0
    loc = -1

    while x + 3 < len(DNAstr):
        if DNAst[x:x+3] == "ATG" or DNAstr[x:x+3] == "GTG" :
            loc = x

        if loc is not -1:
            yield loc

        loc = -1

StopIteration 不是错误。这是生成器发出信号表示它用尽了所有数据的方式。您只需要“尝试排除”它,或者在已经为您执行此操作的 forloop 中使用您的生成器。尽管它们并没有那么复杂,但可能需要一些时间来适应这些“奇怪”的错误。;)

于 2017-06-20T23:40:01.780 回答
2

您的生成器被构建为在其整个生命周期中仅返回一个值。它遍历while循环,找到所有locations,并一举返回整个列表。因此,当您send第二次调用时,您已经用尽了生成器的操作。

您需要弄清楚每次调用send;的期望是什么。配置您的循环以产生那么多,然后产生结果......并为将来的调用yield继续这样做。send您的yield语句必须在循环中才能正常工作。

Jayme在他的回答中给了你一个很好的例子。

于 2017-06-20T23:40:12.710 回答
0

有一个内置的find()函数可以在给定字符串中查找子字符串。这里真的需要发电机吗?

相反,您可以尝试:

import sys

with open(sys.argv[1]) as f:
    text = f.read()

for i, my_string in enumerate(text.strip().lower().split()):
    atg_index = my_string.find('atg')
    gtg_index = my_string.find('gtg')
    print(i, atg_index, gtg_index, my_string)
于 2017-06-21T00:11:44.813 回答
0
def find_start_positions (DNAstr = ""):
    DNAstr = DNAstr.upper()

    x = 0
    loc = -1

    while x + 3 < len(DNAstr):
        if DNAst[x:x+3] == "ATG" or DNAstr[x:x+3] == "GTG" :
            loc = x

        if loc is not -1:
            yield loc

        loc = -1
于 2021-01-24T16:33:08.643 回答