4

我正在微调语言模型,并计算训练和验证损失以及训练和验证的困惑。在我的程序中,它是通过采用损失的指数来计算的。我知道较低的困惑代表更好的语言模型,并且想知道一个好的模型的值范围是多少。任何帮助表示赞赏。谢谢你。

4

0 回答 0