2

我正在尝试使用该neuralnet包在 R 中实现一个简单的深度 Q 学习案例。

我有一个具有初始随机权重的初始网络。我用它为我的代理生成一些经验,结果,我得到了状态和目标。然后我将状态拟合到目标并获得一个具有新权重的新网络。

我如何结合新的权重和初始权重?我是否只是保留新权重并丢弃初始权重?

4

0 回答 0