首先是 mahout、apache、maven 等的新手——如果这很明显,请道歉。
我有一个典型的购物篮数据集,即
用户 1,项目 1
用户 1,项目 2
用户 2,项目 1
用户 2,项目 3
用户 3,项目 2
我的查询 - 对 user3 有什么建议?(是的,我知道答案是 item1!)。
我如何构建它以在 Mahout 中使用?我查看了页面 - https://cwiki.apache.org/MAHOUT/recommender-documentation.html - 这非常有用 - 但就在我想要有趣的位时 - 即如何构建相关数据 - 它说:
// Construct the list of pre-computed correlations
Collection<GenericItemSimilarity.ItemItemSimilarity> correlations =
...;
ItemSimilarity itemSimilarity =
new GenericItemSimilarity(correlations);
而我要计算的那一点是缺失的......!
虽然这完全是错误的做法,但我调整了我的数据集,使其看起来与 movielens 结构相同(给出 5 作为评级,但实际上它应该是二进制真的),但所有用户的所有建议始终相同产品清单。
请问有什么建议吗?