对于推荐引擎,这些技术的优点和缺点是什么(矩阵分解:ALS、pearson 或 cossin 相关性)以及我们如何决定使用哪种技术。
问问题
1666 次
1 回答
3
使用皮尔逊相关性的协同过滤存在一些问题。我将列出一些大的:
可扩展性
当您的数据库增长时,计算用户之间的皮尔逊相关性将花费越来越长的时间。由于您必须计算每个用户之间的相关性,这将呈指数增长。数据稀疏性
这对于大多数推荐引擎来说是一个大问题。如果您有很多用户和很多带有少量评论的商品,那么生成推荐将变得困难,因为您的数据太少而无法计算用户之间的相关性。冷启动问题
从技术上讲,每种方法都存在这个问题,但矩阵分解比协同过滤器处理得更好。冷启动问题基本上意味着您没有或几乎没有任何关于用户的数据。当您使用协作过滤器时,您无法解决此问题。时期。
您可以使用替代技术来解决这个问题,即基于内容的过滤。
确定应该使用哪种方法可能很困难。矩阵分解优于传统的基于用户和基于项目的协同过滤,但您必须确定它是否最适合您的模型。
如果您没有稀疏数据库,则协作过滤器会很好用,但矩阵分解方法也可以。
以下是一些有趣的网站,其中包含有关这些方法的数据。最后,由您或您的团队决定哪种方法最有效。
内容和协同过滤:http ://recommender-systems.org/
如果这还不够清楚,请随时询问更多!
于 2016-11-07T11:14:22.340 回答