1

另一种问这个问题的方法是:我们可以使用来自不同数据集的相对排名来产生全球排名吗?

假设我有各种数据集,它们根据婴儿动物的可爱标准进行排名:1)小猫,2)小狗,3)树懒,4)大象。我使用成对比较(即,向人们展示两张动物的随机图片并要求他们选择最可爱的一张)来获得这些排名。我也有数据集中的全部比较(即,所有小狗在小狗数据集中相互比较)。

我现在正在尝试将数据集合并在一起,以生成最可爱动物的全球排名。

相对排名的主要问题是一组中最可爱的动物不一定是另一组中最可爱的。例如,假设小象被认为没有吸引力,那么最不可爱的小猫总是会击败最可爱的大象。我应该如何解决这个问题?

我正在考虑对数据集(小猫与大象、小狗与小猫等)进行一些交叉比较,以创建某种基本重要性,但是当我添加动物的数量和动物的类型时,这可能会成为问题。

我也在考虑进一步研究填充稀疏矩阵,但我认为这仅适用于一个数据集,而不是跨多个数据集进行比较?

4

1 回答 1

1

您可以使用评分系统完成您的任务,例如最知名的EloGlicko或我们的排名。评级系统允许从成对比较开始建立排名,并且

  • 你不需要做所有的比较,也不需要所有的动物都参与相同数量的比较,
  • 您不需要仅在特定数据集内进行比较(让所有动物与所有其他动物“比赛”,然后如果您需要对一个数据集进行排名,只需使用全局排名忽略其他动物)。

使用rankade(这里是与上述排名系统和 Microsoft 的TrueSkill的比较),您也可以记录 2+ 个项目的输出,而使用 Elo 或 Glicko 则不能。人们对许多项目进行排名是非常混乱和困难的,但是在你的工作中,一个小的多重比较(例如 3-5 个动物)应该是合适和有用的。

于 2016-10-09T15:00:27.690 回答