我正在使用 Matlab 专门进行 DQN 强化学习,我正在检查通过Matlab 示例给出的演示示例。
训练块,如果我们不想进行训练,Matlab 会使用保存的代理。在上面的块中,我们还可以定义一些关于何时保存代理的条件。
我已附上matlab 保存的代理数据文件,并尽我所能在保存的代理数据文件中找到经过训练的权重,该代理将用于在部署时执行模拟,但找不到这些权重的任何痕迹,只能找到训练选项和其他的东西。
我的问题是如何为保存的代理找到那些经过训练的权重,如果保存的代理数据文件不包含经过训练的权重,它如何在部署时实际工作。