考虑到大数据的爆炸式增长,在生产中部署预测模型似乎没有太多选择。
我了解开源 PMML 可用于将模型导出为 XML 规范。然后可以将其用于数据库内评分/预测。然而,要完成这项工作,您似乎需要使用 Zementis 的 PMML 插件,这意味着该解决方案并不是真正的开源。是否有更简单的开放方式将 PMML 映射到 SQL 以进行评分?
另一种选择是使用 JSON 而不是 XML 来输出模型预测。但在这种情况下,R 模型会放在哪里?我假设它总是需要映射到 SQL...除非 R 模型可以与数据位于同一服务器上,然后使用 R 脚本针对传入的数据运行?
还有其他选择吗?