1

我在稳定的基线中看到可以评估线性时间表,以便在训练期间不断降低学习率。

我想知道在稳定的基线中是否有任何实现,可以使用线性计划来降低训练期间 A2C 模型中的熵系数。

任何帮助将非常感激。

4

0 回答 0