-1

我正在使用 Mahout Apache 编写基于项目的推荐器(基于用户的相似项目评级),我想知道以下两个相似性指标中哪一个最适合使用:

Pearson、Spearman、Euclidean、Tanimoto 和对数似然

4

1 回答 1

0

如果您有偏好值,则应使用人相关或欧几里得距离相似度度量。如果您没有偏好值,则应使用 Tanimoto 系数或对数似然。要选择使用哪个缩小范围,您应该对数据集执行评估。这就是使用 mahout 评估框架的原因。您可以评估许多指标,例如均方误差 (MSE)、绝对均方误差、精度、召回率、MAP...

我编写了调整余弦相似度,皮尔逊相关的变体,它可以提供更好的结果,但速度较慢。

于 2014-11-26T20:47:16.843 回答