我正在构建一个推荐器,其中使用 ItemSimilarityJob 完成实际的相似性计算,然后通过 FileItemSimilarity 将其加载到非分布式推荐器中。
到目前为止,所有这些都有效(2),但有一件事我有点困惑。
在实例化推荐器(GenericItemBasedRecommender)时,我必须传递一个数据模型——在我的例子中是 FileDataModel,但由于相似度计算已经发生,我真的不知道我应该传递什么数据进入模型?
显然,该模型用于确定最大和最小偏好值以及项目和用户 ID。关于我打算只拥有匿名“个人资料”的用户 - 那么传递虚假数据可以吗?
这对工作的支持如何 - Mahout 示例 (1) 和 MiA 书没有对此给出任何答案,但都表示预计算是要走的路:(
(1) 我在 Mahout 0.7 上运行,但也已经查看了主干。
(2) 当然,我必须自己将生成的相似度矩阵转换为文本格式。