0

POMDP 的大多数示例都是离散问题,并且所有状态都是已知的。就像老虎问题一样,我们知道有两种状态。但是,在对自动驾驶汽车进行建模时,状态总是设置为 {Sego, S1,..., Sn} (Sego = [x,y,theta,v])。实际上,我们并不知道所有的州。那么如何理解这个 pomdp 模型并编码呢?

4

0 回答 0