1

假设我有两个列表:

L1: [1,2,3,4]
L2: [1,3,2,4,5]

如何计算这两个列表之间的相似度?

如果这两个列表长度相同,Spearman 和 Kendall 似乎是答案,但这个原则是否也可以扩展到不同长度的列表?

4

2 回答 2

2

生物信息学和语言分析领域也有类似的问题。您可以使用各种序列内核(例如,参见 Corinna Cortes 的论文)并编辑距离

于 2016-03-24T13:42:55.080 回答
2

似乎一个有前途的算法来衡量一个列表的相似性是使用 Spearman 脚尺距离http://people.revoledu.com/kardi/tutorial/Similarity/FootruleDistance.html,或者更多涉及并考虑到顺序,折扣累积增益, DCG,https: //www.kaggle.com/wiki/NormalizedDiscountedCumulativeGain 。

该主题的一个非常好的资源是

http://arxiv.org/pdf/1107.2691.pdf

http://theory.stanford.edu/~sergei/slides/www10-metrics.pdf

于 2016-03-27T19:27:02.103 回答