问题标签 [pentaho-spoon]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
407 浏览

pentaho - Pentaho Spoon 作业在厨房中执行精细、无休止的循环

在没有过多讨论的情况下,我有一个 Pentaho PDI 作业,其中包含多个子转换和子作业(从 MySQL 到 Postgres 的 ETL)。该作业完全按照 Spoon 的预期运行,没有错误,但是当我使用以下命令运行作业时,我在第一步遇到了一个无限循环错误,其中需要定义并从内部传递参数这项工作(命令中的命名参数似乎可以很好地集成)。我正在使用的命令如下:

有没有人遇到过 Spoon 和 Kitchen 之间存在差异的此类问题?我是否缺少某种配置或命令行选项?我在 OS X 10.11.4 上运行版本 6.0.1.0-386。

如果您认为更多细节会有所帮助,请告诉我,我可以提供任何必要的信息。

0 投票
1 回答
220 浏览

pentaho - Pentaho Kettle:在运行时更改元数据

我想知道 Kettle (AKA Pentaho PDI) 是否支持在运行时更改元数据。

我已经实现了几个自定义插件:

  • 第一个插件将数据发送到第二个插件。当某些情况发生时,输出中发送的行的元数据可能会发生变化。实际上,这意味着processRow()从某个元数据开始,然后在一段时间后更改它。当然,输出中发送的行putRow()始终与相关元数据同步。
  • 第二个插件从第一个插件接收数据,调用getInputRowMeta()了解接收行的元数据。但是,此类元数据似乎与接收到的行不同步。

鉴于这个简单示例的结果,我想知道 Kettle 引擎是否支持这种运行时行为 --- 即是否getInputRowMeta()为已接收的特定行返回正确的元数据。

是否有人能够提供证据证明元数据更改实际上是不可能的?否则,是否有任何安全的方法来获取接收到的特定行的元数据processRow()

0 投票
1 回答
354 浏览

pentaho - 每周只运行一次的简单评估?

我想运行一个作业,如果这是本周第一次运行作业,它将通过一个额外的步骤。我发现我可以使用简单评估进行此评估,但我找不到如何进行“每周一次”检查。

有人知道我该怎么做吗?

0 投票
0 回答
349 浏览

pentaho - 使用 pentaho 水壶创建触发器文件

我有一个日志表,每次加载主表时都会捕获日志,我需要的是每次更新日志表时都需要使用 pentaho 水壶创建一个触发器文件。并且日志表在 teradata 中。

任何继续进行的示例或方法都将非常有帮助。

谢谢

0 投票
1 回答
106 浏览

pentaho - Kettle:具有不同元数据的行的收集器

在 Kettle 中,我有两个具有不同元布局的步骤,它们将数据发送到充当数据收集器的通用用户定义 Java 类(参见下图以供参考)。

to 步骤发送的输出行具有不同的元数据。但是,用户定义的 Java 类总是看到到达的第一行的元数据getInputRowMeta()总是返回相同的信息。

是否有任何方法可用于获取(刷新)有关由返回的特定行的元数据的信息getRow()

在此处输入图像描述

0 投票
1 回答
771 浏览

json - Unexpected Error when using JSon URL input in spoon

I am trying to import a json in spoon. It works just fine with a file .json but when I try it from a URL I get the Unexpected Error, followed by the java null pointer exception, when executing the transformation.

I get the same error with "JSON input", and with "Get content" followed by "extract from stream" which seems to be very alike.

For the simple test I used for URL : http://echo.jsontest.com/name/James/age/25

I tried with the "Json INPUT", selected the checkbox field as an URL, tried with the URL above (with and without the http://). And in the fields parametre I used the same ones that worked well with a file input (instead of URL). So the JSONPATH are $.name and $.age

I also tried starting from the sample data "Json input - read incoming stream" and switching it to URL like it was described in this post : http://forums.pentaho.com/showthread.php?135741-Issues-with-JSON-Input-step

I am working on a distant server running on debian (jessie version). I use pentaho 6.1

I feel like I've tried everything but I might be missing something obvious.

I apologize for my poor level of english. If more information is needed just ask. Thank you.

0 投票
1 回答
751 浏览

csv - 如何从 CSV 文件中获取数据并使用 Pentaho 将它们发送到 Excel?

我有一个表格 csv 文件,它有七列并包含以下数据:

我是 pentaho 的新手,我想设计一个将数据(7 列的值)移动到空的 excel 表的转换。excel表格有不同的列名,但应该携带相同的数据,如图:

我尝试使用以下一系列步骤来设计转换,但它最终给了我无法解释的错误。

步

在这种情况下,将数据从 csv 文件移动到 excel 工作表的正确设计是什么?有什么想法可以解决这个问题吗?

0 投票
0 回答
81 浏览

pentaho - 水壶:对话框中的自定义错误行

我正在为 Pentaho PDI (AKA Kettle) 设计一个自定义插件。如果出现错误,我的方法会通过特定的元布局processRow()发送错误行。putError()运行时行为很好,但是在设计时连接步骤时,对话框会抱怨,因为它们认为错误行具有不同的布局。

我的问题是:如何设置RowMetaInterface对话框使用的错误行?我尝试调用BaseStep.getErrorRowMeta()and BaseStep.setErrorRowMeta()方法,但对话框仍然看到错误的布局。

0 投票
1 回答
1867 浏览

sql - Pentaho Execute SQL Statements 变量转换为null

我正在使用 PDI 从数据库中删除和插入一些数据。我有以下问题。我创建了两个名为 START_DATE 和 END_DATE 的变量,用于选择将从我的数据库中删除的数据。我能够获取它们并在日志文件中没有错误地运行我的转换,但是当我检查数据是否被删除时,我发现它没有。我发送检查了我的“DeleteProcedure”步骤,它显示“转换错误:null”。我尝试了不同的方法来获取变量并将它们作为字符串传递,但我无法解决这个问题。它不可能是一个 SQL 错误,因为我用一个常量对其进行了测试并且它可以工作。

有任何想法吗?我附上一些图片。谢谢!

这就是我尝试获取变量的方式

我正确地得到了我的变量

0 投票
1 回答
725 浏览

error-handling - 在 Pentaho 数据集成中处理错误时如何获取错误描述

如何在处理错误时获取异常描述,例如,如果字段的数据类型不兼容 PDI 会因任何原因引发违规行。那么如何得到解释呢?