我是新手。
我已经使用了 mahout 的基于项目的算法和对数似然相似性度量。我在过去的帖子中读到,当推荐器处理二进制值(喜欢或不喜欢)时,最好使用对数似然相似性。我还读到 mahout 使用三个值(喜欢、不喜欢、不存在)。所以我对输入数据集文件的格式有点困惑。
输入文件格式必须是这样的吗?
userId, itemID
默认情况下的首选项是1?
我想知道是否有办法将不喜欢的信息放入数据集中。
除了输入数据集文件之外,我会是这样的:
userid, itemid, binaryPreference 1, 15, 1.0
2, 35, 0
1、25、1.0……
请帮帮我!提前谢谢!