0

我正在使用 Pytorch 在 SageMaker 上构建 BERT 二进制分类。

之前在运行模型时,我将 Batch size 设置为 16,模型能够成功运行。但是,昨天我停止 SageMaker 并在今天早上重新启动后,我无法再运行 Batch size 为 16 的模型。我能够运行批量大小为 8的模型。
但是,模型没有产生相同的结果(当然)。中间我没有改变任何东西。所有其他设置都相同。(除了我将 SageMaker 卷从 30GB 更改为 200GB。)

有谁知道什么可能导致这个问题?我真的很想重现批量大小为 16 的结果。

任何答案都会有所帮助,并在此先感谢您!

4

0 回答 0