我找到了 7 个超参数的最佳结果,即:
- 层数,
- 节点大小,
- 激活函数,
- 学习率,
- 势头,
- 批量大小,
- 优化器
使用 Optuna 多目标优化。我将培训和验证损失最小化作为我的目标。由于调整参数的数量更多,我将每个跟踪的 epoch 数量减少为 50。然后我得到了最好的参数,进行了 Optuna 优化。我增加了 epoch 大小并使用torch.manual_seed
. 但是在相同的第 50 个 epoch 之后获得的结果与我在 Optuna 结果中获得的结果不同。
我错过任何东西的原因是什么?我想在相同的条件下重现相同的结果!