3

我正在阅读一篇名为Medium 上的差异学习率的文章,想知道这是否可以应用于 Keras。我能够找到在 pytorch 中实现的这种技术。这可以在 Keras 中实现吗?有人可以提供任何示例代码吗?

4

1 回答 1

1

从 开始,在:Tensorflow 2.4中有一个论点。它是一个接受和返回对列表的函数列表。您可以通过此参数将差分学习率实现为根据网络中的权重位置降低学习率的转换。 tf.keras.optimizers.Optimizergradient_transformers[(gradient, Variable), ...]

于 2021-09-28T17:37:35.450 回答