tensorflow - 解释 textsum 解码文件（输出多于输入？）

Question

我在一个小型测试集（5 个示例）上运行 textsum 解码，但是参考和解码文件都已经有数千行了。解码似乎无限期运行是否有原因？它是否重复处理同一组示例？以后的输出应该比以前的更好吗？

希望对此有一些直觉；我一直找不到明确的解释。

score 0 · Accepted Answer

是的，您的想法是正确的，相同的输入被重复用于生成输出。但是，您可以将输出限制为一个。不久前我通过修改seq2seq_attention_decode.py将输出写入文件来做到这一点。我只给了一个输入，所以在一个输出之后，我希望它停止。

解码看似无限期运行是否有原因？：这只是我的直觉，预计在不同的运行中会给出不同的总结。当解码在不同于训练它的机器上运行时，它应该使用生成新模型并因此给出不同的输出。随着培训过程的继续，这可能是一种监控输出变化的方法。

1 回答 1