另一种问这个问题的方法是:我们可以使用来自不同数据集的相对排名来产生全球排名吗?
假设我有各种数据集,它们根据婴儿动物的可爱标准进行排名:1)小猫,2)小狗,3)树懒,4)大象。我使用成对比较(即,向人们展示两张动物的随机图片并要求他们选择最可爱的一张)来获得这些排名。我也有数据集中的全部比较(即,所有小狗在小狗数据集中相互比较)。
我现在正在尝试将数据集合并在一起,以生成最可爱动物的全球排名。
相对排名的主要问题是一组中最可爱的动物不一定是另一组中最可爱的。例如,假设小象被认为没有吸引力,那么最不可爱的小猫总是会击败最可爱的大象。我应该如何解决这个问题?
我正在考虑对数据集(小猫与大象、小狗与小猫等)进行一些交叉比较,以创建某种基本重要性,但是当我添加动物的数量和动物的类型时,这可能会成为问题。
我也在考虑进一步研究填充稀疏矩阵,但我认为这仅适用于一个数据集,而不是跨多个数据集进行比较?