lstm - 推理模型在编码器-解码器中重复预测相同的单词

翻译自：https://stackoverflow.com/questions/56376444 2019-05-30T10:29:33.760

141 次

我正在使用 LSTM 训练编码器-解码器，用于在 Amazon Kindle 数据集上生成抽象的评论摘要。对于每个输入，输出摘要略有不同，但它们会重复生成几个单词。

我已经尝试在每个解码器时间步对 softmax 概率进行随机抽样。因此，每个输入的结果都不同，但与输入文本无关。在每个时间步绘制 softmax 概率的直方图显示了相似的分布，尽管数字略有不同。我试过降低学习率

输入：我很喜欢这本书写得很好会再读一次很好读

输出：SOS 不能强调压力压力压力撕裂撕裂弯曲

0 回答 0