我们正在使用Prediction.IO
我们的推荐引擎。
部署完成后(pio deploy),我们可以调用部署后创建的web服务,在需要的时候一次得到一个用户的推荐结果。我们还可以在一次调用中为多个用户发送多个请求。
因为我们有数十亿个事件和数以亿计的用户实体,所以使用来自 http 端口的 Web 服务并不是导出数据和分析数据的快速方法,比如在 Hive 中。
问题是,我们找不到为所有用户导出推荐的方法(假设每个用户有 10 条推荐)。
有一个命令(pio export)来导出所有的事件数据,但这不包含得分值或推荐结果。
关于找到批量导出结果的方法有什么想法吗?