我正在尝试构建一个推荐引擎,因为我正在考虑使用 apache mahout,但我无法确定 mahout 是实时处理数据还是在服务器空闲时预处理数据并存储结果数据库中的某处。
还有人知道像亚马逊、Netflix 这样的网站采用什么方法吗?
我正在尝试构建一个推荐引擎,因为我正在考虑使用 apache mahout,但我无法确定 mahout 是实时处理数据还是在服务器空闲时预处理数据并存储结果数据库中的某处。
还有人知道像亚马逊、Netflix 这样的网站采用什么方法吗?
要么/或,但不是两者兼而有之。旧项目中的某些部分基本上是实时的,适用于中等规模。还有一些基于 Hadoop 的实现都是离线的。两者没有关系。
我是这些部分的主要创建者,如果您想要一个同时完成这两个部分的系统,我建议您查看我当前的项目 Myrrix ( http://myrrix.com )