0

我正在构建一个推荐器,其中使用 ItemSimilarityJob 完成实际的相似性计算,然后通过 FileItemSimilarity 将其加载到非分布式推荐器中。

到目前为止,所有这些都有效(2),但有一件事我有点困惑。

在实例化推荐器(GenericItemBasedRecommender)时,我必须传递一个数据模型——在我的例子中是 FileDataModel,但由于相似度计算已经发生,我真的不知道我应该传递什么数据进入模型?

显然,该模型用于确定最大和最小偏好值以及项目和用户 ID。关于我打算只拥有匿名“个人资料”的用户 - 那么传递虚假数据可以吗?

这对工作的支持如何 - Mahout 示例 (1) 和 MiA 书没有对此给出任何答案,但都表示预计算是要走的路:(


(1) 我在 Mahout 0.7 上运行,但也已经查看了主干。

(2) 当然,我必须自己将生成的相似度矩阵转换为文本格式。

4

1 回答 1

1

您应该传递DataModel提供给相似性计算的相同内容。推荐者的输出当然是相似度的函数,但是,当然也是原始数据!这就是为什么它是一个输入。

理论上,您可以建立与DataModel您实际提出建议的数据不同的相似之处。这是可能的,在某些情况下可能有意义,但不正常。

于 2013-06-30T17:29:48.927 回答