我一直在关注用户行为数据,1. 喜欢 2. 不喜欢 3. 评分 4. 浏览过的产品 5. 购买过的产品
spark MLlib 支持置信度为 0 或 1 的隐式行为数据,参考 ( http://spark.apache.org/docs/latest/mllib-collaborative-filtering.html )。
例如,用户 1 查看了产品 A,那么模型将类似于
1,A,1(userId、productId、二进制置信度)
但是通过观察行为的性质,被喜欢的产品比被观看的产品更有信心。购买的产品比查看的产品更有信心。
如何根据行为类型对数据进行建模?