7

我一直在关注链接以使用 textsum。我已经使用提供的命令训练了模型。但我在“textsum/log_root/”目录中没有看到任何文件夹“train”。由于训练是在样本文件上进行的,该模型是否能够处理实时测试数据?如果没有,我该如何制作训练数据并训练模型?最重要的是如何测试/使用模型来查看结果汇总?

4

1 回答 1

2

老实说,如果您正确传递了所有参数,我真的无法回答为什么在 log_root 目录中看不到 train 文件夹。要注意的另一件事是确保您等待足够长的时间。因此,当您使用 Textsum 执行训练运行时,您是否看到任何详细日志说明存在一些错误,例如没有文件列表或其他内容。如果是这样,那么传递给其中一个参数的路径可能已关闭。它也与您调用它的路径相关,因此您需要确保您位于工作区文件所在的根路径。

另一件事,您使用的是CPU还是GPU?如果您使用的是 CPU……模型需要一段时间才能达到甚至能够写出数据的程度。现在,如果您使用的是 GPU,那么这会快得多,但是您需要等到看到“average_loss”日志开始打印到您的屏幕上。一旦你注意到这些,那么你很有可能会看到包含数据的“train”文件夹。

至于“实时”测试数据,我自己还在研究这个,现在我已经在模型中训练了我当前的数据,我也将从这个开始。到目前为止,我理解的方向是,一旦你训练了你的模型并有了你的泡菜文件或任何 ti,你就可以使用这里的信息“服务”它:https ://tensorflow.github.io/serving/

那时,您的模型已经过训练,您可以对其进行查询并提供新的响应,因此随着时间的推移,您的模型会变得更加智能。同样,我还没有用一个例子证明这一点,但这是我很快将在这里开始的方法。

关于“测试模型”,您几乎可以按照 textsum git 上提供的说明,重新生成 vocab 文件,然后进行训练。然后,在您将平均损失降低到足够小的比例之后,您就可以对数据运行解码。然后在您的 log_root 解码文件夹中,您将看到生成的标题及其相关的参考文件(实际标题是什么)。希望这会有所帮助,祝你好运!

于 2016-10-14T17:36:53.297 回答