Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我在稳定的基线中看到可以评估线性时间表,以便在训练期间不断降低学习率。
我想知道在稳定的基线中是否有任何实现,可以使用线性计划来降低训练期间 A2C 模型中的熵系数。
任何帮助将非常感激。