我正在处理一个推荐问题,它涉及 300 万用户和 500,000 个产品。推荐的目的是在访问给定产品时向特定用户推荐 5-10 多个产品。
我们完成了实时推荐引擎部分,但我们发现1-2秒推荐并不那么容易。我们考虑两种策略:
以批处理模式离线运行推荐,然后将结果存储在MySQL DB 中。但是,表中的条目数似乎是一个巨大的数字。每个产品的每个用户应至少存储 5-10 个推荐产品。如果我创建一个以用户和产品作为表属性的表,将有 300 万 x 500,000 个条目。
即时预测推荐。我们刚试了一下,但是响应时间太长了。
谁能给我一些关于这个问题的建议?