0

我试图在 matlab 的 cvx 块中找到 argmax。这只是为了使用线性规划找到贝尔曼方程的最优策略。在下面的代码中,如果我这样做:

k = max(Q)

它找到列表 Q 的最大值并且工作正常,但只要我这样做:

[k y] = max(Q)

要找到列表 Q 的 argmax,它会抱怨:

??? Error using ==> cvx.max
Too many output arguments.

在 cvx 中找到 argmax 有不同的方法吗?

cvx_begin
variable V(N)
minimize(sum(V))

subject to
for s=1:N
    for a=1:A
        for s_next=1:N
            tmp(s_next) = mdp.T{a}(s,s_next)*(mdp.R{a}(s,s_next) + mdp.gamma*V(s_next));
        end
        Q(a) = sum(tmp);
        V(s) >= sum(tmp);
    end
    [k y]=max(Q)
end  
cvx_end
4

1 回答 1

0

所以我最终使用对偶变量来找到最优策略。我仍然不确定是否有办法在 cvx 中找到 argmax。

于 2013-09-09T18:08:08.087 回答