-1

我正在尝试建立一个对句子进行分类的模型。我正在使用递归神经网络(RNN)模型“GRUcell”,我有以下图表。我使用的损失函数是交叉熵。你能解释一下为什么每次迭代后的损失接近 0 到 1 吗?我找不到任何解释,谢谢。 在此处输入图像描述

4

1 回答 1

-1

根据您提供的信息,它看起来像是在批次结束时下降,并在下一批开始时再次上升。这可能是由于高学习率而随着时间的推移没有足够的衰减。尝试调整参数,看看是否有帮助。

干杯

于 2017-07-12T10:17:26.297 回答