我想实现一个可以实时生成推荐音乐播放列表的音乐推荐系统。我相信这可以在 Prediction.io 中实现......
但是,由于 Prediction.io 的设计,我需要调用 pio train、pio deploy,以便使用用户执行的新操作(如音乐等)更新学习模型。因此,我需要运行这些命令每 2 小时(或另一个适当的时间间隔)。
我最近遇到了 Apache Storm,我真的很喜欢“实时 hadoop”处理的概念。因此,我在考虑是否可以将 Prediction.io 与 Apache Storm 结合起来,以便“在线”完成学习,这将允许我的应用程序在用户的一些喜欢/动作中推荐音乐,而不是让用户等待直到学习模型更新。
如果这不可行,那么是否可以将 Spark 的 Mllib 合并到 Apache Storm bolt (java) 中,因为我可以用它构建推荐系统(而且 Prediction.io 本身似乎也是基于 Apache Spark 构建的)?
提前致谢!