我想使用我训练有素的 RL 模型进行离散测试预测。
这是模型的构建方式:
model = Sequential()
model.add(Dense(60, activation='relu', input_shape=states))
model.add(Dense(60, activation='relu', input_shape=states))
model.add(Dense(60, activation='relu', input_shape=states))
model.add(Dense(actions, activation='linear'))
动作空间是一个离散值。观察空间是一个简单的浮点值:
self.action_space = Discrete(len(ACTION_MAP))
observation_high = np.finfo(np.float32).max
self.observation_space = Box(low=np.array([-observation_high]), high=np.array([observation_high]))
测试功能运行良好:
scores = dqn.test(env, nb_episodes=1, visualize=False, verbose=1, callbacks=[CustomCallback()])
但是当我这样做时:
print(dqn.model.predict_step([30]))
我收到此错误:
ValueError:密集层的输入0与层不兼容::预期的min_ndim = 2,发现ndim = 0。收到的完整形状:()
它是做出预测的正确方法吗?输入数据应该是什么样的?