有没有办法用盒子定义自定义动作空间?
在我的例子中,我想创建一个包含 3 个变量的连续动作空间,这些变量是三角形的边,所以它们必须满足三角不等式。如果我这样做
self.action_space = spaces.Box(low=0., high=110., shape=(3,),dtype=np.float32)
我的代理人将探索所有可能的组合,其中一些是不允许的。if
我可以在方法的开头使用一些条件step
,但我认为在环境声明中定义动作空间会更好。
感谢帮助
有没有办法用盒子定义自定义动作空间?
在我的例子中,我想创建一个包含 3 个变量的连续动作空间,这些变量是三角形的边,所以它们必须满足三角不等式。如果我这样做
self.action_space = spaces.Box(low=0., high=110., shape=(3,),dtype=np.float32)
我的代理人将探索所有可能的组合,其中一些是不允许的。if
我可以在方法的开头使用一些条件step
,但我认为在环境声明中定义动作空间会更好。
感谢帮助