问题标签 [pentaho-spoon]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
pentaho - Pentaho Spoon 作业在厨房中执行精细、无休止的循环
在没有过多讨论的情况下,我有一个 Pentaho PDI 作业,其中包含多个子转换和子作业(从 MySQL 到 Postgres 的 ETL)。该作业完全按照 Spoon 的预期运行,没有错误,但是当我使用以下命令运行作业时,我在第一步遇到了一个无限循环错误,其中需要定义并从内部传递参数这项工作(命令中的命名参数似乎可以很好地集成)。我正在使用的命令如下:
有没有人遇到过 Spoon 和 Kitchen 之间存在差异的此类问题?我是否缺少某种配置或命令行选项?我在 OS X 10.11.4 上运行版本 6.0.1.0-386。
如果您认为更多细节会有所帮助,请告诉我,我可以提供任何必要的信息。
pentaho - Pentaho Kettle:在运行时更改元数据
我想知道 Kettle (AKA Pentaho PDI) 是否支持在运行时更改元数据。
我已经实现了几个自定义插件:
- 第一个插件将数据发送到第二个插件。当某些情况发生时,输出中发送的行的元数据可能会发生变化。实际上,这意味着
processRow()
从某个元数据开始,然后在一段时间后更改它。当然,输出中发送的行putRow()
始终与相关元数据同步。 - 第二个插件从第一个插件接收数据,调用
getInputRowMeta()
了解接收行的元数据。但是,此类元数据似乎与接收到的行不同步。
鉴于这个简单示例的结果,我想知道 Kettle 引擎是否支持这种运行时行为 --- 即是否getInputRowMeta()
为已接收的特定行返回正确的元数据。
是否有人能够提供证据证明元数据更改实际上是不可能的?否则,是否有任何安全的方法来获取接收到的特定行的元数据processRow()
?
pentaho - 每周只运行一次的简单评估?
我想运行一个作业,如果这是本周第一次运行作业,它将通过一个额外的步骤。我发现我可以使用简单评估进行此评估,但我找不到如何进行“每周一次”检查。
有人知道我该怎么做吗?
pentaho - 使用 pentaho 水壶创建触发器文件
我有一个日志表,每次加载主表时都会捕获日志,我需要的是每次更新日志表时都需要使用 pentaho 水壶创建一个触发器文件。并且日志表在 teradata 中。
任何继续进行的示例或方法都将非常有帮助。
谢谢
json - Unexpected Error when using JSon URL input in spoon
I am trying to import a json in spoon. It works just fine with a file .json but when I try it from a URL I get the Unexpected Error, followed by the java null pointer exception, when executing the transformation.
I get the same error with "JSON input", and with "Get content" followed by "extract from stream" which seems to be very alike.
For the simple test I used for URL : http://echo.jsontest.com/name/James/age/25
I tried with the "Json INPUT", selected the checkbox field as an URL, tried with the URL above (with and without the http://). And in the fields parametre I used the same ones that worked well with a file input (instead of URL). So the JSONPATH are $.name and $.age
I also tried starting from the sample data "Json input - read incoming stream" and switching it to URL like it was described in this post : http://forums.pentaho.com/showthread.php?135741-Issues-with-JSON-Input-step
I am working on a distant server running on debian (jessie version). I use pentaho 6.1
I feel like I've tried everything but I might be missing something obvious.
I apologize for my poor level of english. If more information is needed just ask. Thank you.
csv - 如何从 CSV 文件中获取数据并使用 Pentaho 将它们发送到 Excel?
我有一个表格 csv 文件,它有七列并包含以下数据:
我是 pentaho 的新手,我想设计一个将数据(7 列的值)移动到空的 excel 表的转换。excel表格有不同的列名,但应该携带相同的数据,如图:
我尝试使用以下一系列步骤来设计转换,但它最终给了我无法解释的错误。
在这种情况下,将数据从 csv 文件移动到 excel 工作表的正确设计是什么?有什么想法可以解决这个问题吗?
pentaho - 水壶:对话框中的自定义错误行
我正在为 Pentaho PDI (AKA Kettle) 设计一个自定义插件。如果出现错误,我的方法会通过特定的元布局processRow()
发送错误行。putError()
运行时行为很好,但是在设计时连接步骤时,对话框会抱怨,因为它们认为错误行具有不同的布局。
我的问题是:如何设置RowMetaInterface
对话框使用的错误行?我尝试调用BaseStep.getErrorRowMeta()
and BaseStep.setErrorRowMeta()
方法,但对话框仍然看到错误的布局。
error-handling - 在 Pentaho 数据集成中处理错误时如何获取错误描述
如何在处理错误时获取异常描述,例如,如果字段的数据类型不兼容 PDI 会因任何原因引发违规行。那么如何得到解释呢?