0

像ddpg一样,我们保存(s, a, r, s_next),能不能把s_next的预测结果放到s中。是否违反 MDP

4

0 回答 0