问题标签 [pmml]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - jpmml 输入错误
我正在测试 jpmml 评估器。我有以下代码:
我在评估行收到此错误:
我理解这个错误,但我不知道它为什么会触发。我确保 myargs
不为空,并且不包含任何空值。没有问题,为什么fields
。我想也许我没有正确转换我的双精度值,但是使用String.valueOf()
而不是Double.toString
没有解决问题。我在这里缺少什么吗?
pmml - PMML 子字符串处理长字符串的官方规范是什么?
给定一个子串定义
如果输入字符串“helloworld”会发生什么,官方规范是什么?
是不允许的,还是应该发生其他事情?
java - 是否存在可以帮助查找 PMML 语法和/或逻辑错误的 PMML 调试器?
在过去的几周里,我花了很多时间处理语法错误或逻辑错误的 PMML 文件。我当前的流程包括查看 PMML 文件并逐步执行 JPMML 代码,直到我找出问题所在。
我发现的常见问题,
- PMML 中的变量未在任何地方定义
- DerivedField If-Else 语句出现缺失变量并且不使用 missingValueReplacement
- 尝试将字符串值相乘
- 在 DataDictionary 中未枚举的分类变量的 MiningSchema 中定义的 invalidValueTreatment 意味着永远不会使用 invalidValueTreatment。
PMML 有哪些调试工具?
任何有助于语法或逻辑调试的工具都会有所帮助。
java - 使用 JPMML 评估 SAS 生成的 PMML 文件时得分不匹配
我有一个从 SAS Miner 生成的 PMML,我无法使用 JPMML 1.2.6 进行正确评估。与 SAS 相比,我的分数有显着差异。
早些时候,我收到了一个 FMTWIDTH 错误,并使用中提到的解决方案解决了它
https://stackoverflow.com/a/33157862/1808924
任何想法为什么我没有使用 JPMML 获得相同的分数?
r - r2pmml 的问题
我最近将包 r2pmml 及其所有依赖项安装在R
. 但是,当我尝试将我的 gbm 模型对象转换为 pmml 时,它会引发此错误:
当谈到 java 时,我是一个菜鸟,任何帮助都将不胜感激!
java - sklearn2pmml 和 jpmml-sklearn 使用错误
我最近在寻找将 scikit-learn 模型转换为 PMML 的方法时遇到了sklearn2pmml和jpmml-sklearn 。但是,在尝试使用我无法弄清楚的基本用法示例时,我遇到了错误。
当尝试在sklearn2pmml中使用示例时,我收到以下关于将 long 转换为 int 的问题:
关于这里发生了什么的任何建议?
使用代码:
编辑 12/6:在新的更新之后,同样的问题出现在更远的地方:
spline - 在 PMML 中定义样条函数的最佳方法是什么?
有没有人在 PMML 中定义了样条函数(即 defineFuction)?
有很多参数需要定义,数学相当冗长。例如,对于具有 3 节限制三次样条的预测器,我有七个参数(包括两个系数、三个节点、一个参考点和一个预测器名称)。数学包括一些指数、最大语句等。
这是我的 Javascript 代码示例,用于计算 3 结 RCS 的值。
pmml - PMML 的 TransformedValue 输出 - 特定于实现的差异
我的 PMML 模型中有一些派生字段,我想将其公开为输出字段。并且....我可以让它在 Augustus 和 JPMML 中工作(通过 OpenScoring),但我似乎必须稍微不同。我想知道是否有人对他们中的哪一个做得正确有任何看法?PMML 规范似乎并没有 100% 清楚这一点。
对于 JPMML,我可以通过引用我想要的派生字段来做到这一点,并且我必须避免将它们作为“预测”包含在 MiningSchema 中。
但这不适用于奥古斯都。为此,我需要将这些输出声明为 MiningSchema 中的“预测”字段。
因此,我必须根据我期望的目标评分环境生成不同的 PMML……这听起来不太好。但是哪一个做得对呢?还是有另一种更便携的表达方式?
在上述所有片段中,foo_derived只是基于foo_input输入值的派生字段。无论是本地转型还是全球转型,似乎都没有任何区别。
r - 获得由 caret::train 生成的 glm 类型模型的 pmml 表示
我正在尝试从caret
使用method='glm'
. 示例模型:
这个相关问题的一个不被接受的答案type='rf'
表明使用矩阵接口是不可能的。
所以我无法使用矩阵或公式语法获得 pmml (我很确定finalModel
无论如何都会产生相同的 s ):
它在带有公式界面的基本 glm 中工作:
为了互操作性,我想继续使用caret
. 有没有办法将some_glm
产生的转换caret
回pmml()
可以接受的格式?glm()
或者如果我想要 pmml 功能,我是否被迫使用该结构?
performance-testing - PMML应用程序的性能测试
您能否告诉我对基于 JPMML 评估器和/或我们自己的 PMML 评分引擎的 PMML 应用程序进行性能测试的最佳实践。我在http://dmg.org/pmml/pmml_examples/index.html找到了一些示例 PMML 和相应的测试数据。但我正在寻找非常大的数据(代表实际的客户交易数据集)。另外,我知道 JPMML 1.2.6 比 1.2 快 10 倍左右,但会消耗一些额外的内存。在大型数据集(GB 数据集)上验证它的最佳实践是什么