问题标签 [pdi]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3250 浏览

linux - Pentaho - CSV 输入不理解特殊字符 [Windows 到 Linux]

我对 Pentaho 数据集成进行了转换,我做的第一件事是使用“CSV 输入”来映射我的平面文件。

我在 Windows 上从来没有遇到过问题,但现在我正在将我的服务器换成勺子将运行到 linux 服务器上,现在我遇到了特殊字符的问题。

我注意到的第一件事是我的表正在更新,因为系统将名称理解为与我数据库中的名称不同的字符串。

检查问题时,我还注意到,如果我转到“CSV 输入”-> 预览,它将显示我的数据的预览,其中包含上述问题:

特殊字符不显示

它应该在哪里:

我使用命令检查了我的文件字符集/编码,它显示:

如果我在 vi 上打开 foo.csv,它会理解特殊字符。

关于可能是什么问题或我应该尝试什么的任何想法?

0 投票
1 回答
29 浏览

pdi - 在 windows 上安装后如何登录 pentaho 数据集成

我已经安装了 pentaho 数据集成。我不知道从哪里开始,我的意思是我应该单击哪里来运行已安装文件夹中的应用程序。

0 投票
0 回答
1731 浏览

pentaho - Pentaho 数据集成kettledatabase异常

我是 PDI 的新手。我一直在尝试检索 ID 号并将其存储到 csv 文件中。但是我不断收到以下错误

kettledatabaseexception pentaho,无法关闭查询:结果集或准备好的语句

2015/06/01 16:36:58 - 轨道:获取 CDC 事务。0 - 开始运行... 2015/06/01 16:36:58 - 选择 CDC.0 的值 - 开始运行... 2015 /06/01 16:36:58 - 文本文件 output.0 - 开始运行... 2015/06/01 16:36:58 - 轨道:获取 CDC 事务。0 - 从流中读取查询参数 [选择值CDC] 2015/06/01 16:36:58 - 轨道:获取 CDC transactions.0 - 从步骤中读取 [为 CDC 选择值] 2015/06/01 16:36:58 - 选择 CDC.0 的值 - 得到行从上一步开始:[0] 2015/06/01 16:36:58 - CSV 文件 input.0 - 完成处理(I=2,O=0,R=0,W=1,U=0,E=0 ) 2015/06/01 16:36:58 - 为 CDC.0 选择值 - 将行写入下一步:[0] 2015/06/01 16:36:58 - 如果字段值为 null.0 - 发出“输出”信号done' 到 1 个输出行集。2015/06/01 16:36:58 - 如果字段值为空。0 - 完成处理 (I=0, O=0, R=1, W=1, U=0, E=0) 2015/06/01 16:36:58 - 为 CDC.0 选择值 - Signaling '输出done' 到 1 个输出行集。2015/06/01 16:36:58 - 选择 CDC.0 的值 - 完成处理(I=0,O=0,R=1,W=1,U=0,E=0)2015/06/01 16:36:58 - 轨道:获取 CDC 事务。0 - 找到查询参数 = [0] 2015/06/01 16:36:58 - 轨道:获取 CDC 事务。0 - SQL 查询:SELECT tb.* FROM gl_history tb哪里 tb.ptid > ?2015/06/01 16:36:58 - 文本文件 output.0 - 错误(版本 5.2.0.0,buildguy 从 2014-09-30_19-48-28 构建 1):意外错误 2015/06/01 16:36 :58 - 文本文件 output.0 - 错误(版本 5.2.0.0,buildguy 从 2014-09-30_19-48-28 构建 1):org.pentaho.di.core.exception.KettleStepException:2015/06/01 16 :36:58 - 文本文件 output.0 - 字段 [calc_amt] 不能' 在输入流中找不到!2015/06/01 16:36:58 - 文本文件 output.0 - 2015/06/01 16:36:58 - 文本文件 output.0 - 在 org.pentaho.di.trans.steps.textfileoutput.TextFileOutput.processRow (TextFileOutput.java:139) 2015/06/01 16:36:58 - 文本文件 output.0 - 在 org.pentaho.di.trans.step.RunThread.run(RunThread.java:62) 2015/06/01 16:36:58 - 文本文件 output.0 - 在 java.lang.Thread.run(Thread.java:722) 2015/06/01 16:36:58 - Orbit :Get CDC transactions.0 - 在放置时停止缓冲区上的行 2015/06/01 16:36:58 - 轨道 - 声明已取消!2015/06/01 16:36:58 - 轨道 - 声明取消!2015/06/01 16:36:58 - 轨道 - 声明取消!2015/06/01 16:36:58 - 轨道 - 声明取消!2015/06/01 16:36:58 - 替​​换 null .0 - 在缓冲区中放置一行时停止 2015/06/01 16:36:58 - 文本文件输出。0 - 关闭正常文件... 2015/06/01 16:36:58 - 轨道:获取 CDC 事务。0 - 完成读取查询,关闭连接。2015/06/01 16:36:58 - 替​​换 null .0 - 完成处理 (I=0, O=0, R=6, W=5, U=0, E=0) 2015/06/01 16: 36:58 - 文本文件 output.0 - 完成处理 (I=0, O=1, R=1, W=0, U=0, E=1) 2015/06/01 16:36:58 - T_STG_ORBIT_serialize_generic_for_fact_gl_history -转换检测到一个或多个有错误的步骤。2015/06/01 16:36:58 - T_STG_ORBIT_serialize_generic_for_fact_gl_history - 转型正在扼杀其他步骤!2015/06/01 16:36:58 - T_STG_ORBIT_serialize_generic_for_fact_gl_history - 查看步骤:CSV 文件输入 2015/06/01 16:36:58 - 轨道:获取 CDC 事务.0 - 错误(版本 5.2.0.0,从 2014 年构建 1 -09-30_19-48-28 by buildguy):关闭查询时出现意外错误:org.pentaho。di.core.exception.KettleDatabaseException:2015/06/01 16:36:58 - 轨道:获取 CDC 事务。0 - 无法关闭查询:结果集或准备好的语句 2015/06/01 16:36:58 - 轨道:获取 CDC 事务。0 - 已在此语句上调用取消。2015/06/01 16:36:58 - 轨道 - 与数据库的连接已关闭!2015/06/01 16:36:58 - 轨道:获取 CDC 事务。0 - 完成处理(I=50,O=0,R=1,W=48,U=0,E=1)2015/06/ 01 16:36:58 - T_STG_ORBIT_serialize_generic_for_fact_gl_history - 查看步骤:如果字段值为空 2015/06/01 16:36:58 - T_STG_ORBIT_serialize_generic_for_fact_gl_history - 查看步骤:选择 CDC 的值 2015/06/01 16:36:58 - T_STG_ORBIT_serialize_generic_for_fact_gl_history - 查看步骤:轨道:获取 CDC 事务 2015/06/01 16:36:58 - T_STG_ORBIT_serialize_generic_for_fact_gl_history - 查看步骤:替换空值 2015/06/01 16:36:58 - T_STG_ORBIT_serialize_generic_for_fact_gl_history - 查看步骤:文本文件输出 2015/06/01 16:36:58 - T_STG_ORBIT_serialize_generic_for_fact.5.2.gl_history buildguy 从 2014-09-30_19-48-28 构建 1):检测到错误!2015/06/01 16:36:58 - 勺子 - 改造完成!!2015/06/01 16:36:58 - T_STG_ORBIT_serialize_generic_for_fact_gl_history - 错误(版本 5.2.0.0,buildguy 于 2014-09-30_19-48-28 构建 1):检测到错误!2015/06/01 16:36:58 - T_STG_ORBIT_serialize_generic_for_fact_gl_history - 错误(版本 5.2.0.0,buildguy 于 2014-09-30_19-48-28 构建 1):检测到错误!2015/06/01 16:36: 58 - T_STG_ORBIT_serialize_generic_for_fact_gl_history - 转换检测到一个或多个有错误的步骤。2015/06/01 16:36:58 - T_STG_ORBIT_serialize_generic_for_fact_gl_history - 转型正在扼杀其他步骤!2015/06/01 16:36:58 - T_STG_ORBIT_serialize_generic_for_fact_gl_history - 查看步骤:CSV 文件输入 2015/06/01 16:36:58 - T_STG_ORBIT_serialize_generic_for_fact_gl_history - 查看步骤:如果字段值为空 2015/06/01 16:36 :58 - T_STG_ORBIT_serialize_generic_for_fact_gl_history - 查看步骤:为 CDC 选择值 2015/06/01 16:36:58 - T_STG_ORBIT_serialize_generic_for_fact_gl_history - 查看步骤:轨道:获取 CDC 事务 2015/06/01 16:36:58 - T_STG_ORBIT_serialize_generic_for_fact_gl_history - T_STG_ORBIT_serialize_generic_for_fact_gl_history步骤:替换 null 2015/06/01 16:36:

0 投票
0 回答
186 浏览

java - 安装我自己的插件后无法启动 Spoon/PDI

我正在为我的 pentaho PDI 安装开发一个新的插件/步骤。

问题是,如果步骤在 plugin/steps 文件夹中,我无法启动勺子,如果我把它拿出来,我可以正常启动它,所以,这肯定是我的步骤有问题,但看不到它有什么问题,至少不仅仅是通过查看代码......

我做了一些其他的没有问题,但是这个不想让我的勺子安装运行:/

有人可以提供某种输入吗?我知道至少有人必须做一个插件......

0 投票
1 回答
1040 浏览

pentaho - 无法在 Pentaho 水壶中获取电子邮件附件

我正在尝试使用“电子邮件消息输入”在水壶(Pentaho PDI)中提取电子邮件附件,我查看了其他示例,它们都遵循此示例 ,这里输入步骤不同“获取邮件(POP3 / IMAP)”并且可以指定如何处理附件。我正在使用 PDI 5.2,并在 5.3 中尝试过,但不存在第二种类型的输入“pop3/imap”。

有没有其他方法可以获取附件?谢谢你的帮助

0 投票
2 回答
3905 浏览

linux - Kettle - 用逗号作为小数点读取 CSV

我对 Pentaho 数据集成(又名 Kettle)进行了转换,我做的第一件事是使用“CSV 输入”来映射我的平面文件。

我在 Windows 上的这一步从来没有遇到过问题,但是现在我正在将 spoon 将要运行的服务器更改为 linux 服务器,现在我遇到了解析问题(将字符串转换为整数)。

简而言之,转换的作用是:

CSV 输入:用于映射我的 CSV 中的所有字段。我使用 ISO-8859-1 编码。

过滤行:用于获取一些特定的行。

Script Values/Mod:用于更改某些字段的某些值。


现在,导致问题的步骤:

选择/重命名值:用于将标题重命名为我的表列,以便我可以在我的表中插入数据。每个选项卡上有什么?

选择和更改(选项卡)*省略空字段

Fieldname Rename to      
Código      codigo_cliente 

元数据(选项卡)*省略空字段

Fieldname Rename to      Type      Binary to Normal Data Format Lenient? Lenient number conversion? 
Código      codigo_cliente Integer   N                         N                                  N                                            


我得到的错误是:

出现问题的原因是,在此字段中,我在 CSV 文件中使用逗号作为小数点。

这是我的 CSV 文件的样子:

我的 CSV 文件的标题:

其中一行:

如果更容易看到,我在该行中名为“Código”的列(稍后将在“选择值”步骤中变为“codigo_cliente”)的值为87.979,00

在不更改我的 CSV 文件的情况下解决此问题的最佳方法是什么?

0 投票
2 回答
647 浏览

json - 如何在 Pentaho 中将上一步中的字段设置为 JSON 输出文件名?

我想在我的 Pentaho 数据集成转换中使用连接字段作为 Json 输出文件名,但只要我没有看到任何“接受字段作为文件名”选项,我就不知道如何实现这一点。

有人可以帮我解决吗?

提前致谢!

0 投票
1 回答
145 浏览

pentaho - PDI 作业看到不一致的 JCR 内容

我编写了一个 Kettle 作业,将文件从 Pentaho 5.3 (SP201505) JCR 文件夹移动到 Windows 文件系统文件夹(在同一台服务器上;Server 2008 R2 Enterprise)。作业的“移动”部分使用选中了删除源文件选项的复制文件步骤。

最初,作业按预期运行,将所有文件从源 JCR 文件夹移动到目标文件系统文件夹。

在此作业再次运行之前,Pentaho 用户已将新文件放入源 JCR 文件夹中。但是,当我下次运行此作业时,它不再看到源 JCR 文件夹中的任何文件,即使我可以从 PUC 中浏览它们。

我在 Spoon 中运行这项工作(在编码和测试时)。它使用 VFS 协议jcr-solution来访问 JCR 文件夹中的文件。

该作业是否需要在每次运行时进行某种存储库刷新以查看对 JCR 文件夹的更改,如果需要,如何在作业中完成此操作?

0 投票
1 回答
7118 浏览

pentaho - 从结果步骤获取行并在 Pentaho 数据集成中获取变量使用

任何人都可以提供在pentaho数据集成中从结果步骤中获取变量和获取行的示例。

  1. 我的工作有两个转变。
  2. 第一个转换采用样本输入并生成样本输出,最后我将行复制到结果步骤。
  3. 我的第二次转换从结果步骤和一个假人中获取了行。
  4. 当我运行我的工作时,我不会在假人中得到输出。
  5. 我什至尝试使用获取变量步骤而不是从结果步骤获取行,即使我没有得到输出。
  6. 那么,我该如何解决这个问题。
0 投票
1 回答
135 浏览

pentaho - Pentaho:使用公共参数更新数据库记录

使用 Pentaho,我想用转换的一些公共参数的值更新数据库记录。我知道我可以在某些步骤中使用参数的值,例如Table inputDatabase Join通过检查Replace variable选项。但是,我找不到任何方法来传递转换的公共参数的值以便逐步使用Update。任何人都可以帮助我吗?

为了澄清:我想使用这里定义的参数转换的公共参数