algorithm - 如何优化数据库建议引擎

Question

我正在制作一个用于逐项推荐电影的在线引擎。我已经进行了一些研究，我认为实现它的最佳方法是使用pearson 相关性并制作一个包含 item1、item2 和相关字段的表，但问题是在每个项目速率之后，我必须重新生成相关性最坏情况 N 条记录（其中 N 是项目数）。

我读到的另一个想法是下面的文章，但我还没有想到实现它的方法。

那么您对优化这个过程有什么建议呢？或者有什么其他建议？谢谢。

score 0 · Accepted Answer

没有最佳解决方案，但您可以通过查看 Stack Overflow 上的“协作过滤”标签或“推荐引擎”标签找到很多建议。

score 0 · Accepted Answer

当前解决此类“购物车”问题的方法是使用奇异值分解 (SVD)。NetFlix Prize 的前 3 名参与者都使用了 SVD。SVD用于对巨大的products*persons协方差矩阵进行“降维”。好消息是存在增量方法（向数据集添加一些观察结果并不意味着重新计算整个矩阵）。

2 回答 2