0

我正在用它的 tf_agents.networks.q_network.QNetwork 训练我的 tf_agents.agents.DqnAgent,不幸的是,权重太大了。所以我认为 L2-Regularization 将是一个好主意。但是,不可能将自己的正则化层添加到 QNetwork 并且在文档中我也找不到任何方法将正则化损失添加到训练过程中。

有谁知道使用 tf_agents 库规范深度 Q 学习的优雅方法?非常感谢您!

4

0 回答 0