我正在调试一个序列到序列的模型,并故意尝试完美地过拟合约 200 个样本的小数据集(长度在 5-50 之间的句子对)。我在 pytorch 中使用负对数似然损失。我得到低损失(~1e^-5),但在同一数据集上的准确率只有 33%。
我也在 3 个样本上训练了模型,并获得了 100% 的准确率,但在训练期间我有损失。我的印象是,如果预测标签和目标标签之间不匹配,负对数似然只会产生损失(损失在 ~1e^-5 的同一区域内)?
我的代码中可能存在错误吗?
我正在调试一个序列到序列的模型,并故意尝试完美地过拟合约 200 个样本的小数据集(长度在 5-50 之间的句子对)。我在 pytorch 中使用负对数似然损失。我得到低损失(~1e^-5),但在同一数据集上的准确率只有 33%。
我也在 3 个样本上训练了模型,并获得了 100% 的准确率,但在训练期间我有损失。我的印象是,如果预测标签和目标标签之间不匹配,负对数似然只会产生损失(损失在 ~1e^-5 的同一区域内)?
我的代码中可能存在错误吗?