问题标签 [pdi]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
223 浏览

mysql - 如何避免滚动执行作业(pentaho 数据集成)

我有一份工作可以进行多次转换。一些转换包含 mysqlbulkloader。但是我的问题是要了解为什么我知道每次出现这种错误时我的执行结果都会返回,所以我会感觉工作运行了两次。

0 投票
2 回答
2364 浏览

pentaho - 转型调度开始

当我在 Pentaho 的文本文件输入控件中预览行时,没有行出现,并且“显示日志”选项显示此消息

这是什么意思?如何克服这个问题?

0 投票
1 回答
1058 浏览

unix - 杀死后在后端运行的进程

我在 unix 服务器中运行了 1 个 kitchen.sh 命令,该命令将根据某些逻辑将一些 INSERT/UPDATE 数据从一个表加载到另一个表。但是由于输入数据的数量很大。所以我不得不通过以下命令终止中间的进程

kill -9 pid (pid =进程ID)

然后我用 ps -ef |签入了服务器 grep kitchen 命令并且该过程没有显示。所以我认为它被杀死了。

但是我现在注意到每天都有很少的记录在更新,并且该过程以某种方式在后端运行。任何解决方案,例如如何检查以及如何解决它

0 投票
1 回答
7744 浏览

pentaho - 在 pentaho 数据集成中拆分字符串

我是 pentaho 数据集成的初学者,我想用以下形式拆分一个字符串: FIRSTNAME LASTNAME CODE 我想从代码中分离出名字和姓氏,注意姓氏可以包含多个单词。我考虑过根据空格分隔符拆分所有字符串,但问题是名称有时可能由两个以上的单词组成。你能告诉我实现这一目标的步骤吗?

0 投票
1 回答
5395 浏览

pentaho - Pentaho ETL:数据库连接与表输入

我需要通过一些转换将数据库表数据写入文本文件。有两个步骤可用于从表中检索数据,即表输入和数据库连接。除了“外部连接”之外,我认为它们之间没有太大区别?选项(如果我理解错误,请纠正我)。那么哪个更好用呢?

环境:

数据库:甲骨文

Pentaho Spoon : 5.3.* (社区版)

提前致谢。

0 投票
1 回答
2910 浏览

pentaho - Pentaho ETL : Modified Javascript Step "SKIP_TRANSFORMATION" 转换常量工作逻辑

为什么 SKIP_TRANSFORMATION 仅在 CONTINUE_TRANSFORMATION 分配给 trans_Status 时才有效?我无法在wiki 链接中找到有关此的信息


提前致谢。

0 投票
2 回答
446 浏览

xml - 在 Spoon PDI 中移动文件夹

我正在尝试移动我在 Spoon PDI 中处理的文件夹。任务是从文件夹中提取一个 XML 文件,并将其内容上传到数据库。我已经成功地完成了这项工作。现在,我需要将整个文件夹移动到存档中。但是,我对此有疑问。当我试图移动文件夹时,只有 XML 文件被移动,文件夹仍然存在。

我需要移动整个文件夹,而不仅仅是文件夹的内容(XML 文件)。

知道怎么做吗?

0 投票
0 回答
3224 浏览

pentaho - Pentaho ETL:从“表输入”到“表输出”的数据

设想 :

生成行:(4 份)

表格输入:(4份)

延迟行:(4份)

表输出:(1份)

数据库:

转换完成后,my_table 中的值仅填充为 0(总共 40 个零)。为什么表输入在第一轮执行(第 2 到第 10 轮)后没有得到实际的行数。或者我在这个设计中犯了什么错误?

在此处输入图像描述

Pentaho : Kettle - Spoon 通用版本 - 5.3.0.0-213

Java : jdk1.8.0_51 (64)

操作系统:Windows 8.1 (64)

Oracle:Oracle Database 11g Express Edition Release 11.2.0.2.0 - 生产

分析后添加更多信息

在表输出的四个链接中,我删除了一个链接的延迟。所以我得到了一些预期的结果。所以我消除了所有的延迟,我得到了预期的结果。但我无法理解原因。

0 投票
1 回答
607 浏览

pentaho - PDI 插件,getInputRowMeta() 抛出非指针异常

在我的插件中,我尝试从上一步获取元数据信息,以便我可以根据元数据信息(列名)对行数据进行一些处理。

它可以根据数据正常工作,因为 r = getRow() 可以获取数据。但是当调用 getInputRowMeta() 来获取上一步的行元时,它会抛出非指针异常。

代码示例如下(主要是 processRow() 函数。)

调用getInputRowMeta()时,抛出异常如下:

有没有我应该设置的 StepMeta 类、StepData 类的地方?

0 投票
1 回答
269 浏览

hbase - 从 Pentaho 中的 Hbase 扫描所有列

我是 Pentaho 和 HBase 的新手。我想从 Hbase 表中读取所有列并使用 Pentaho 将其加载到平面文件中。

一件主要的事情是,我的 Hbase 表中的列不是静态的。有些日子我会得到 30+ 列,有些日子可能会变成 50+。

我尝试在 PDI 中使用“Hbase 输入”。但我无法定义列数。有没有办法在 Pentaho 中定义动态变化的列?