0

关于具有二进制相关值(0 和 1)的数据上的逐点和成对学习排名算法之间的差异,我有两个问题。假设成对算法的损失函数计算标签为 0 的条目在标签为 1 的条目之前排名的次数,而逐点算法的损失函数计算估计的相关值与实际相关值之间的总体差异。

所以我的问题是:1)理论上,这两组算法的表现会有显着不同吗?2)在这种设置下,成对算法会降级为逐点算法吗?

谢谢!

4

1 回答 1

0

在逐点估计数据中跨行的错误(包含项目和用户的行,您希望对每个用户/查询中的项目进行排名)被假定为独立类型,类似于正态分布的错误。而在成对评估中,经常使用的算法损失函数是交叉熵 - 一种将每对中的 1 和 0 准确分类为 1 和 0 的相对度量(带有信息 - 即,其中一个项目优于其他项目)。

所以变化是pair-wise可能比point-wise学习得更好。

我能看到的唯一例外是一种业务场景,即用户单击项目而不逐项评估/比较项目。不过,这极不可能。

于 2018-09-14T21:52:13.280 回答