1

我们目前正在探索在 hadoop 集群上部署 Zementis ADAPA 或他们的 UPPI 插件。我们计划将 SAS 模型提取到 PMML 并进行部署。

然而,除了从 SAS 中提取的模型之外,我们还需要在 PMML 中表达更简单的“模型”/分类规则。

一个例子是:

input: var1, var2
rule: var1 >= var2
output: 'true' of 'false'

我目前正在考虑将其表达为一个非常简单的决策树(PMML 中的 TreeModel)或一个非常简单的规则集(PMML 中的 RuleSet)。

以下是我的问题:

  1. 我是否使用了正确的模型?
  2. 这甚至是正确的方法吗?在 PMML 中是否有另一种表达规则的方法?
  3. 这甚至是对 PMML 提出的正确要求吗?还有其他人使用 PMML 来表达这样的规则吗?
4

1 回答 1

1

由于 PMML 文档总是期望存在某种“模型”,因此您必须通过放入一个虚拟回归模型来从本质上欺骗它。然后,您将在输入预处理 ( TransformationDictionary ) 中使用 PMML 的“ if-then-else ”构造来执行“规则/逻辑”,以“导出”您的答案字段。之后,您必须使用“输出”元素输出这个派生字段。

我知道这只是太多的工作,太少的好处。我这样做只是作为概念验证,我们决定不在 PMML 中做简单的规则。

于 2013-04-04T22:53:42.020 回答