0

我正在制作一个用于逐项推荐电影的在线引擎。我已经进行了一些研究,我认为实现它的最佳方法是使用pearson 相关性并制作一个包含 item1、item2 和相关字段的表,但问题是在每个项目速率之后,我必须重新生成相关性最坏情况 N 条记录(其中 N 是项目数)。

我读到的另一个想法是下面的文章,但我还没有想到实现它的方法。

那么您对优化这个过程有什么建议呢?或者有什么其他建议?谢谢。

4

2 回答 2

0

没有最佳解决方案,但您可以通过查看 Stack Overflow 上的“协作过滤”标签或“推荐引擎”标签找到很多建议。

于 2011-03-14T06:04:43.353 回答
0

当前解决此类“购物车”问题的方法是使用奇异值分解 (SVD)。NetFlix Prize 的前 3 名参与者都使用了 SVD。SVD用于对巨大的products*persons协方差矩阵进行“降维”。好消息是存在增量方法(向数据集添加一些观察结果并不意味着重新计算整个矩阵)。

于 2011-10-23T14:34:50.157 回答