我正在学习排名。我发现某些损失函数(例如 0/1 损失)不能直接最小化为非凸或不连续等。这在其他损失函数的情况下也是如此。
因此研究人员使用了另一种称为“凸代理”的损失函数,它“限制”了 0/1 类型的损失,他们试图最小化损失函数的代理以找到参数(如果我理解正确的话)。
我的问题是,在给定非凸损失函数的情况下,找到代理函数的过程是什么?
我可以在哪里阅读我有一个非凸损失函数的步骤,并且我想设置它的代理损失?
还有我怎么知道某些函数是 0/1 损失的上限。
以及如何提出这个界限?
我正在学习排名。我发现某些损失函数(例如 0/1 损失)不能直接最小化为非凸或不连续等。这在其他损失函数的情况下也是如此。
因此研究人员使用了另一种称为“凸代理”的损失函数,它“限制”了 0/1 类型的损失,他们试图最小化损失函数的代理以找到参数(如果我理解正确的话)。
我的问题是,在给定非凸损失函数的情况下,找到代理函数的过程是什么?
我可以在哪里阅读我有一个非凸损失函数的步骤,并且我想设置它的代理损失?
还有我怎么知道某些函数是 0/1 损失的上限。
以及如何提出这个界限?