我正在使用以下代码和嵌套生成器来迭代文本文档并使用get_train_minibatch()
. 我想保留(腌制)生成器,这样我就可以回到文本文档中的同一位置。但是,您不能腌制生成器。
是否有一个简单的解决方法,以便我可以保存我的位置并从我停止的地方重新开始?也许我可以做
get_train_example()
一个单例,所以我周围没有几个发电机。然后,我可以在这个模块中创建一个全局变量来跟踪距离get_train_example()
。你有更好(更清洁)的建议,让我坚持这个生成器吗?
[编辑:还有两个想法:
我可以向生成器添加一个成员变量/方法,这样我就可以调用 generator.tell() 并找到文件位置吗?因为那样,下次我创建生成器时,我可以要求它寻找那个位置。这个想法听起来是最简单的。
我可以创建一个类并将文件位置作为成员变量,然后在类中创建生成器并在每次生成时更新文件位置成员变量吗?因为那时我可以知道它进入文件有多远。
]
这是代码:
def get_train_example():
for l in open(HYPERPARAMETERS["TRAIN_SENTENCES"]):
prevwords = []
for w in string.split(l):
w = string.strip(w)
id = None
prevwords.append(wordmap.id(w))
if len(prevwords) >= HYPERPARAMETERS["WINDOW_SIZE"]:
yield prevwords[-HYPERPARAMETERS["WINDOW_SIZE"]:]
def get_train_minibatch():
minibatch = []
for e in get_train_example():
minibatch.append(e)
if len(minibatch) >= HYPERPARAMETERS["MINIBATCH SIZE"]:
assert len(minibatch) == HYPERPARAMETERS["MINIBATCH SIZE"]
yield minibatch
minibatch = []