从 openAI 健身房环境的 step 函数获取输出时 _ 用作第四个变量。是否仅用于我们不想使用的值?使用 _ 而不是任何其他名称有什么好处吗?
import gym
env = gym.make('CartPole-v0')
for i_episode in range(20):
observation = env.reset()
for t in range(100):
env.render()
print(observation)
action = env.action_space.sample()
observation, reward, done, _ = env.step(action)
if done:
print("Episode finished after {} timesteps".format(t+1))
break