我正在寻找实现基于项目的新闻推荐系统。有几种方法我想跟踪用户对新闻项目的兴趣;它们包括:评分 (1-5)、收藏夹、点击率和花在新闻项目上的时间。
我的问题:有哪些好的方法可以将这些不同的指标用于推荐系统?也许以某种方式合并和规范化它们?
我正在寻找实现基于项目的新闻推荐系统。有几种方法我想跟踪用户对新闻项目的兴趣;它们包括:评分 (1-5)、收藏夹、点击率和花在新闻项目上的时间。
我的问题:有哪些好的方法可以将这些不同的指标用于推荐系统?也许以某种方式合并和规范化它们?
研究领域的推荐系统通常以 1 到 5 的等级工作。从用户那里获得如此明确的信号非常好。但是我想现实是,您系统的大多数用户实际上永远不会给出评分,在这种情况下,您没有什么可使用的。
因此,我会跟踪页面浏览量,但也会尝试并结合一些明确的反馈机制(1-5,竖起大拇指或向下等)
您的算法必须考虑到这一点。
对于推荐系统,有两个问题:
如何根据你收集到的数字量化用户对某个项目的兴趣
如何使用量化的兴趣数据向用户推荐新商品
我猜你对第一个问题更感兴趣。
要解决第一个问题,您需要线性组合或其他一些花哨的函数来组合所有数字。确实没有适用于所有系统的单一通用功能。这在很大程度上取决于您的用户和项目的类型。如果你想要一个高质量的推荐系统,你需要有一些数据来做机器学习来训练你的功能。
对于第二个问题,它在某种程度上是同一件事,而且您需要分析所有项目以抽象出彼此之间的一些关系。您可以在 Google 上搜索“Netflix 奖”以获取一些有趣的信息。