0

我正在研究具有混合密度网络最终层提供的自定义损失函数的 Keras 模型(损失试图最小化某些高斯模型的负对数似然)。

让我感到困惑的是,损失有时会达到一个时期,在该时期它返回 -inf 作为结果损失。然后下一次迭代损失将再次是一个数字(例如-2.1)。损失有时会在负无穷大和每隔一个时期出现一个数字之间反弹。

NLL 损失显然可以预料到负损失,但这种波动让我感到困惑。是什么解释了 Keras 中的这种行为?我的理解是 -inf 损失是由某处的数字下溢引起的,但我不确定模型如何从中恢复并在此后重新建立数字稳定性。

有谁知道这是如何工作的?对于其他人可以就这个问题提出的任何建议,我将不胜感激。

4

0 回答 0