0

我必须为具有以下参数的项目设计推荐算法:

  1. 用户的个人资料,其中包含用户的简短描述以及用户的兴趣
  2. 来自 review.com 的产品描述,其中包含产品的分类。

没有任何用户的评分或愿望清单,我只有这些数据,并且必须为用户找到产品的适用性。

4

1 回答 1

0

你的问题很模糊,但如果你基本上只有一系列描述用户的词和一系列描述产品的词,那么我能想到的只是一个简单的相似性度量:

  • 余弦相似度(又名内积)
  • 骰子相似度
  • 杰卡德相似度等

这似乎不是一个好项目,除非我遗漏了一些东西。如果您没有大量数据,那么您的算法/模型/等有多好都没关系。如果是这样,您似乎被要求编写一个美化的字符串相似度函数。

在信息检索中,可以使用 tf-idf(词频逆文档频率)来获得更好的质量结果,但似乎你真的没有什么可使用的......希望有帮助。祝你好运!

于 2013-05-09T05:28:10.850 回答