我是编程/射线的新手,并且有一个简单的问题,即在使用 Ray Tune 时可以指定哪些参数。特别是,光线调谐文档说所有自动填充的字段(steps_this_iter、episodes_this_iter 等)都可以用作停止条件或在调度程序/搜索算法规范中。
但是,以下仅在我删除“episodes_this_iter”规范后才有效。这是否仅作为停止标准的一部分起作用?
ray.init()
tune.run(
PPOTrainer,
stop = {"training_iteration": 1000},
config={"env": qsdm.QSDEnv,
"env_config": defaultconfig,
"num_gpus": 0,
"num_workers": 1,
"lr": tune.grid_search([0.00005, 0.00001, 0.0001]),},
"episodes_this_iter": 2500,
)