1

我有一个具有功耗(p)和延迟(d)参数的目标函数。在给定延迟约束(秒)的情况下,我想最小化功耗。优化问题可以用拉格朗日函数表示如下:

f(p,d) = p + L*d

其中L是拉格朗日变量。由于功耗和延迟成反比,减少前者会导致后者增加,因此目标函数也可以用相对权重写成:

f(p,d) = L*p + (1-L)*d

问题是, “给定d秒的延迟约束,我如何找到可以最小化变量p的适当L值?” . 我想为此目的使用强化学习,在每个状态下,系统都会根据上述功能做出决定并为下一个状态下的前一个动作分配一个成本。每个动作都会在处理请求时导致一定的功耗和延迟。目标是在给定延迟约束的情况下最小化功耗。在这方面的任何建议/提示将不胜感激。

4

0 回答 0