我想构建一个推荐引擎来支持一个在 Rails 上运行并将其数据存储在 MySQL 中的网络应用程序......类似于用户点击事物并且他们的反馈更新数据库,然后在某种实时风格的时尚。数量级我认为所有用户每秒可能进行 10 次交互;每天 100 万个数据点。
我的问题是如何构建和处理分析,以便可以快速处理事情。利用我已经知道的,我可以使用一些 Ruby 和 R(RServe,RSRuby)在现有数据集上运行 SVD/clustering/ensemble/whatevermodels,并通过不时采样更新模型/公式,但这看起来像一种非常笨拙的做事方式。有什么更好的方法来做到这一点?直接在 MySQL 中运行数学?使用一些具有出色数学功能的酷 Ruby 库?使用现成的推荐引擎包?
(尽管查看了建议的所有“类似问题”链接,但我对那里的内容明显缺乏认识。讽刺的是。:()
PS:我的背景:有几年 R 的数字人,但完全用于静态/离线数据。Python、Rails 等的新手程序员,但我可以在这方面工作。