5

我一直在阅读有关成对排名的论文,这是我没有得到的:

逐点排序和成对排序之间的训练/测试数据有什么区别?这是我一直在阅读的论文: http ://www.cs.cornell.edu/people/tj/publications/joachims_02c.pdf

在那里,它说成对排名中的数据点是两个链接之间的不等式:

[行] .=。[两个链路之间的不等式,即目标] qid:[qid] [[链路 1 和 2 的特征]:[1 和 2 的值]] # [信息]

然而, RankLib确实支持 RankNet 和 RankBoost 等成对排名器,但它使用的数据点格式是逐点的

[行] .=。[绝对排名,也就是目标] qid:[qid] [feature1]:[value1] [feature2]:[value2] ... # [info]

有什么我想念的吗?

4

1 回答 1

12

逐点排序类似于回归。每个点都有一个相关的排名分数,您想要预测该排名分数。因此,给定查询,您的标记数据集将具有特征向量和相关的排名分数

即:{d1, r1} {d2, r2} {d3, r3} {d4, r4}

其中 r1 > r2 > r3 > r4

成对排序类似于分类。每个数据点都与另一个数据点相关联,目标是学习一个分类器,该分类器将预测两者中的哪一个与给定查询“更”相关。

即:{d1 > d2} {d2 > d3} {d3 > d4}

于 2013-07-02T04:05:54.800 回答