6

在实现了一个算法来推荐产品并取得了一些成功之后,我现在正在研究计算该算法的初始输入数据的方法。

我的目标是计算用户有某种历史的每种产品的分数。

我目前正在收集的数据:

  • 用户订单历史
  • 匿名用户和注册用户的产品浏览历史记录

所有这些数据都带有时间戳。

我在寻找什么

我正在寻找一些建议,理想情况下,应该更多地讨论这个问题,而不是针对单一的“正确”答案。

  • 我可以为用户收集的任何可以直接暗示对产品感兴趣的其他数据
  • 将这些数据转化为每个产品的分数的算法/方程式

我不是在寻找什么

只是为了避免这个问题因错误的答案而脱轨,一旦我为每个用户获得了这些数据,这就是我正在做的事情:

  • 使用 k-means 聚类算法生成多个用户聚类(目前为 21 个),使用 pearsons 系数作为距离得分
  • 对于每个用户(按需),通过在他们的集群中寻找他们最相似和最不相似的用户并重复任意深度来计算他们的相似用户图。
  • 根据用户图表中其他用户的偏好计算每个产品的分数
  • 对分数进行排序以返回推荐列表

基本上,我不是在寻找关于一旦获得输入数据后该做什么的想法(稍后我可能需要进一步的帮助,但这不是这个问题的重点),只是想知道如何在第一名

4

2 回答 2

2

这是一个干草制造者的回应:

  • 花在看产品上的时间
  • 对产品留下的评论的语义解释
  • 制作关于产品、品牌或产品类别的讨论页面,并从语义上解释评论
  • 如果他们共享产品页面(电子邮件、del.icio.us 等)
  • 浏览器(移动设备可能会让他们在页面上花费更少的时间而不是笔记本电脑,同时表示非常感兴趣)和连接速度(影响在页面上花费的时间)
  • 脸书个人资料相似度
  • 热图数据(例如 à la Kissmetrics)

你卖什么样的产品?这可能有助于我们更好地回答您。(由于这是一个老问题,我正在解决@Andrew Ingram 和其他任何有相同问题并通过搜索找到该线程的人。)

于 2011-03-14T06:16:33.530 回答
1
  1. 您可以允许用户明确说明他们的偏好,就像 netflix 允许用户分配星星一样。
  2. 您可以为他们购买的所有东西分配一个正数值,因为您说您确实有他们的购买历史。为他们没有购买的东西分配零
  3. 你可以为他们购买的东西做某种加权值,根据流行的东西进行调整。(如果几乎每个人都购买了一种产品,那么它并不能告诉您他们也购买了该产品的太多信息)参见“词频-逆文档频率”
  4. 您还可以为用户查看但未购买的商品分配一些较小的数值。
于 2009-08-07T17:58:06.243 回答