我想在每次验证循环结束时保存一个检查点。我将其设置val_check_interval
为0.2
在每个时期都有 5 个验证循环,但检查点回调仅在时期结束时保存模型。在每个验证循环之后,我找不到一种简单(或困难)的方法来保存模型。这似乎有点奇怪,因为除了保存检查点之外,我看不到进行验证循环的理由。
最简单的方法是什么?
谢谢,
吉拉德
我想在每次验证循环结束时保存一个检查点。我将其设置val_check_interval
为0.2
在每个时期都有 5 个验证循环,但检查点回调仅在时期结束时保存模型。在每个验证循环之后,我找不到一种简单(或困难)的方法来保存模型。这似乎有点奇怪,因为除了保存检查点之外,我看不到进行验证循环的理由。
最简单的方法是什么?
谢谢,
吉拉德
来自闪电文档: save_on_train_epoch_end
(Optional[bool]) – 是否在训练周期结束时运行检查点。如果这是 False,则检查在验证结束时运行。
在训练器中使用save_on_train_epoch_end = False
ModelCheckpoint 中的标志进行回调应该可以解决此问题。
你检查过 pytorch_lightning.callbacks.model_checkpoint.ModelCheckpoint吗?不确定它是否存在于您的版本中,但设置every_n_val_epochs
为 1 应该可以。如果是这样,它应该在每个验证循环之后保存您的模型检查点。