我试图在 matlab 的 cvx 块中找到 argmax。这只是为了使用线性规划找到贝尔曼方程的最优策略。在下面的代码中,如果我这样做:
k = max(Q)
它找到列表 Q 的最大值并且工作正常,但只要我这样做:
[k y] = max(Q)
要找到列表 Q 的 argmax,它会抱怨:
??? Error using ==> cvx.max
Too many output arguments.
在 cvx 中找到 argmax 有不同的方法吗?
cvx_begin
variable V(N)
minimize(sum(V))
subject to
for s=1:N
for a=1:A
for s_next=1:N
tmp(s_next) = mdp.T{a}(s,s_next)*(mdp.R{a}(s,s_next) + mdp.gamma*V(s_next));
end
Q(a) = sum(tmp);
V(s) >= sum(tmp);
end
[k y]=max(Q)
end
cvx_end