我想基于多个数据集进行推荐,例如为 Mahout 推荐器使用多个加权数据模型
但我的问题是额外的数据集不能很好地转化为主要项目。我的领域是特定的,但可以将其想象为基于音乐品味推荐电影的问题。
如果我以同样的方式对待电影和音乐,我也会在结果中得到音乐。
我只想使用其他数据集来获得更好的邻域。Mahout 或 Myrrix 可以做到这一点吗?
我想基于多个数据集进行推荐,例如为 Mahout 推荐器使用多个加权数据模型
但我的问题是额外的数据集不能很好地转化为主要项目。我的领域是特定的,但可以将其想象为基于音乐品味推荐电影的问题。
如果我以同样的方式对待电影和音乐,我也会在结果中得到音乐。
我只想使用其他数据集来获得更好的邻域。Mahout 或 Myrrix 可以做到这一点吗?
如果您以相同的方式对待它们,则可以使用Rescorer
该类来过滤掉音乐结果。Myrrix 还可以使用 Rescorer(s)
例如, Mahout in Action 书中的这个Rescorer
示例从推荐中过滤掉了没有库存的书籍。你会做类似的事情,你会(以某种方式)跟踪哪些项目 id 是音乐,然后使用该信息将Rescorer
它们过滤掉,这样它们就不会被推荐。