Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在关注关于微调 DialoGPT(GPT- 2) 使用新的会话数据集。
它之前训练得很好,困惑度大约是 5、6,由此产生的对话似乎很正常。在此处输入图像描述现在,我不确定我是否触及了某个地方......当我绘制训练损失时,我发现它下降到低于 1(大约 0.25)并且困惑度超过 300?