对于持久化和重用训练有素的机器学习模型有什么建议/最佳实践吗?我正在用 Python 或 R 开发模型。然后这些模型必须在生产工作流程中用于评分(其中 R 不可用)。例如,可能有一个在 R 中训练的逻辑回归模型。现在需要针对该模型对新的观察结果进行评分。评分引擎必须快速且可扩展。我想过跟随
PMML ( http://en.wikipedia.org/wiki/Predictive_Model_Markup_Language )。用 R 开发的大多数模型很容易转换为 pmml。但是,我找不到适用于 PMML 模型的有用评分引擎。例如,有 augustus ( https://code.google.com/p/augustus/ ) 但它只实现了 3-4 个模型。
在 Python 中使用 pickle 序列化模型并在 Python 中编写消费者。
关于正确方法的任何想法/建议?