Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
做强化学习的时候,每次都要从头开始训练。这需要很多时间。从以前的训练结果开始训练有什么解决办法吗?谢谢。
如果您正在基于剧集进行强化学习,则可以每 X 集将您训练的网络保存到一个文件中。当您运行脚本时,您可以检查该文件是否存在,并加载它而不是从空网络开始。
如何做到这一点取决于您使用的编程语言。
如果您使用 Python,则可以使用Pickle或JSON模块保存数据、状态表和神经网络权重。