您应该意识到答案可能取决于您要使用的模型元素。您创建 PMML 和解析 PMML 的最佳选择也很可能来自不同的软件包。我将假设“创建 PMML”是指文档而不是模型。我从未听说过有人将自动模型拟合与执行相结合,但也许它已经存在。当然,可以使用 SOAP 传递 PMML 模型。
我无法与其他项目交谈,但 Zementis 提供的名为Adapa的产品仅用于执行PMML。该产品假设有一个模型拟合应用程序,该应用程序将通过将拟合模型导出到 PMML 来进行创建。已经有很多开发良好的模型拟合应用程序,所以我认为这是一个合理的假设。
我使用的版本(3.6)通常速度很快,但如果没有特别大的堆,它无法处理典型随机森林大小(500 多棵树)的集合。我认为他们可能已经在较新的版本中解决了这个问题。尽管没有做广告,但 Zementis 似乎没有提供一些模型,即文本模型、序列、基线模型或时间序列(PMML 标准目前仅具有指数平滑)。我的版本也没有 K-Nearest Neighbors,但我听说更新的版本有。
除非您正在考虑集成装配和执行(在这种情况下您应该考虑在线学习),否则我的建议是按顺序考虑这些问题:
- 我有兴趣使用的模型类型是什么?
- 我更喜欢在哪些应用程序中构建模型?
- 最后,我将如何执行此操作以及在这方面我有什么要求(Web 服务、云、性能等)?
如果您查看 DMG 组的成员列表,您会发现许多商业供应商要么在供应方(例如 SAS、SPSS、Togaware、Rapid-I),要么在需求方(有很多要列出)。
在您的列表中,您也没有提到 Weka,但它们也执行一些 PMML 模型,并且有基于 R/Java 的解决方案,因此您可以在 Java 环境中执行PMML->R 导入(请参阅 fileToXMLNode)(但您也可以只执行R)。
最后,如果您有一个非常具体的模型并且您理解“执行它”在数学上意味着什么,那么自己构建您需要的东西应该不会太难。