我为问答任务训练 Albert 模型。我有 200,000 个问答对,我使用保存的 2gb 检查点文件。我在我的 GPU GeForce 2070 RTX 上对其进行了训练,每次 1000 步以保存检查点,在训练期间检查点model.ckpt-96000.data-00000-of-00001
文件只是保持大小135MB
而不增加。这是一个问题吗?
我不明白为什么对于像 1500 个问答对这样的小得多的数据集,它还会生成 135 MB 的检查点文件。它还没有停止训练,但是模型是否有可能通过这次训练得到改进?