-4

我已经爬过 MTurk 网站。我有 260 个 Hits 作为数据集,并且从该数据集中,特定数量的用户选择了 Hits 并为每个选定的 Hits 分配了评级。现在我想根据他们的选择向这些用户推荐。怎么可能?谁能推荐我任何推荐算法?

4

1 回答 1

0

听起来您应该选择协作过滤 (CF) 算法之一,因为用户以评级的形式有明确的反馈。首先,我建议实现一个简单的基于项目/用户的 k-最近邻算法。如果结果不满足您,并且您的数据可能非常稀疏 - 矩阵分解技术应该可以解决问题。我最近阅读的一项很好的调查是 [1] - 它介绍了针对不同数据设置的不同方法。

如果您对此感到满意并且您意识到您需要的实际上是排名前 N 的预测列表而不是评级,我建议您阅读例如贝叶斯个性化排名[2]。

最好的部分是 - 这些算法非常有名,其中大部分适用于几乎所有编程语言,例如 python -> https://github.com/Mendeley/mrec/

[1] J. Lee、M. Sun 和 G.Lebanon,“协作过滤算法的比较研究”,ArXiv,第 1-27 页,2012 年。

[2] S. Rendle、C. Freudenthaler、Z. Gantner 和 L. Schmidt-thieme,“BPR:来自隐式反馈的贝叶斯个性化排名”,第 25 届人工智能不确定性会议论文集,2009 年,卷. cs.LG,第 452-461 页。

于 2016-03-18T14:23:07.700 回答