17

刚刚阅读了《连线》杂志上的最新文章,我很好奇:Netflix 奖有什么挑战性?我的意思是最真诚的,我只是对比赛带来的困难感到好奇。大多数推荐引擎一般都很难改进吗?如果是这样,那是为什么?或者,Netflix 是否异常难以改进?如果是这种情况,Netflix 有什么特别之处,使它比亚马逊更具挑战性?

4

4 回答 4

30

推荐系统存在难以解决的问题:

  • 冷启动- 在新系统或新用户中,没有足够的数据来为推荐创建准确的统计模型。
  • 评分偏差- 如果您根据用户评分进行推荐,那么评分的用户通常会根据他们的喜好调整结果。如果您是那种不喜欢额外评分步骤的人,那么具有相似品味的人可能也不喜欢评分,因此他们的意见会被排除在推荐之外。
  • 未评级的项目不太可能被评级 - 如果您根据评级选择项目并因此对其进行评级,未评级的项目不太明显,并且很难获得影响推荐所需的评级。在另一个方向上,受欢迎的商品具有更高的知名度,被更频繁地评分,因此在推荐中发挥了更大的作用。
  • 时间偏差- 用户的评分随时间变化。对于长期变化,您可以通过在建议中添加时间元素来进行补偿。短期变化更难修复。在查克诺里斯马拉松之后,你可能更有可能给动作片打高分。第二天,在对《钢木兰》大哭之后,你可能会暂时对动作片产生偏见。
  • 不同的动机 - 在基于项目的推荐系统中,您为姨妈生日购买的针织书会歪曲您的推荐(如果您不花时间告诉系统不要使用它)。你可能会给一部糟糕的儿童电影打高分,因为你的孩子喜欢它。

总之,这使得推荐系统很难改进过去就好了。一个准确率达到 80% 的系统看起来不错,但 5 次中有 1 次是错误的。对于某些用户而言,这使他们遇到的麻烦超过了他们的价值。

于 2009-07-30T18:52:37.807 回答
14

因为 NetFlix 已经有一个非常好的推荐引擎。如果他们知道如何轻松改进它,他们现在就会这样做。他们的整个商业模式是围绕向消费者交叉销售产品(电影)。推荐算法确实是他们业务的核心。效果越好,他们赚的钱就越多。

于 2009-06-19T11:49:28.840 回答
2

我想已经有一些关于这方面的文章,但我现在不知道它们在哪里,所以我将在这里解释一下。

当人们在亚马逊上购买书籍(例如)时,他们倾向于购买特定类型的书籍,因此很容易推荐其他相同类型的书籍。

对于电影,人们可能会做同样的事情,但是人们通常不会将自己局限于一种类型。人们可能会观看更多种类的电影:恐怖片、喜剧片、动作片、爱情片等。

如果您到目前为止只租过一部电影,并且那部电影是一部戏剧,那么从这些类型中预测您喜欢什么可能很难预测。

如果有人想出一个非常聪明的推荐引擎,Netflix 可以从中受益匪浅。我认为他们主要是在寻找一种可以仅根据一两部电影推荐内容的引擎。对 Netflix 知之甚少的新客户如果能尽早找到自己喜欢的电影而无需搜索,他们就有更好的机会留下来。

在我看来,他们已经拥有与亚马逊相当的推荐引擎。我认为他们正在寻求进一步增强它。

于 2009-06-19T11:53:02.093 回答
2

我和我的同事参加了它。我没有很强的人工智能背景,但是推荐引擎需要对现有的文献算法有一些深入的了解,比如 Gibbs 采样、K 方法、最近邻等。我们使用 Gibbs 采样,我可以说我们很烂:) 与 Netflix 已有的相比。

于 2009-06-19T11:55:58.640 回答