35

我想在 OpenAICarRacing-v0环境中设置一个 RL 代理,但在此之前我想了解操作空间。在github第 119 行的代码中说:

self.action_space = spaces.Box( np.array([-1,0,0]), np.array([+1,+1,+1]))  # steer, gas, brake

我如何阅读这一行?虽然我的问题是具体的,但CarRacing-v0我想spaces.Box()总体上理解这个符号

4

1 回答 1

53

Box意味着您正在处理实际有价值的数量。

第一个数组np.array([-1,0,0]是接受的最低值,第二个np.array([+1,+1,+1])是接受的最高值。在这种情况下(使用注释),我们看到我们有 3 个可用的操作:

  1. 转向: 真正的价值[-1, 1]
  2. 气体:实际价值[0, 1]
  3. 刹车: Real value in[0, 1]
于 2017-06-07T05:39:27.890 回答