在 ReduceLROnPlateau 类的 Keras 官方文档(https://keras.io/api/callbacks/reduce_lr_on_plateau/)中,他们提到
“模型通常受益于降低学习率”
为什么呢?至少对我来说这是违反直觉的,因为据我所知 - 更高的学习率允许从我目前的位置采取进一步的措施。
谢谢!
在 ReduceLROnPlateau 类的 Keras 官方文档(https://keras.io/api/callbacks/reduce_lr_on_plateau/)中,他们提到
“模型通常受益于降低学习率”
为什么呢?至少对我来说这是违反直觉的,因为据我所知 - 更高的学习率允许从我目前的位置采取进一步的措施。
谢谢!