我在一个小型测试集(5 个示例)上运行 textsum 解码,但是参考和解码文件都已经有数千行了。解码似乎无限期运行是否有原因?它是否重复处理同一组示例?以后的输出应该比以前的更好吗?
希望对此有一些直觉;我一直找不到明确的解释。
我在一个小型测试集(5 个示例)上运行 textsum 解码,但是参考和解码文件都已经有数千行了。解码似乎无限期运行是否有原因?它是否重复处理同一组示例?以后的输出应该比以前的更好吗?
希望对此有一些直觉;我一直找不到明确的解释。
是的,您的想法是正确的,相同的输入被重复用于生成输出。但是,您可以将输出限制为一个。不久前我通过修改seq2seq_attention_decode.py将输出写入文件来做到这一点。我只给了一个输入,所以在一个输出之后,我希望它停止。
解码看似无限期运行是否有原因?:这只是我的直觉,预计在不同的运行中会给出不同的总结。当解码在不同于训练它的机器上运行时,它应该使用生成新模型并因此给出不同的输出。随着培训过程的继续,这可能是一种监控输出变化的方法。