我们目前正在探索在 hadoop 集群上部署 Zementis ADAPA 或他们的 UPPI 插件。我们计划将 SAS 模型提取到 PMML 并进行部署。
然而,除了从 SAS 中提取的模型之外,我们还需要在 PMML 中表达更简单的“模型”/分类规则。
一个例子是:
input: var1, var2
rule: var1 >= var2
output: 'true' of 'false'
我目前正在考虑将其表达为一个非常简单的决策树(PMML 中的 TreeModel)或一个非常简单的规则集(PMML 中的 RuleSet)。
以下是我的问题:
- 我是否使用了正确的模型?
- 这甚至是正确的方法吗?在 PMML 中是否有另一种表达规则的方法?
- 这甚至是对 PMML 提出的正确要求吗?还有其他人使用 PMML 来表达这样的规则吗?