问题标签 [pentaho-spoon]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
8843 浏览

oracle - Configure Pentaho data Integration to connect to Oracle DB

I have configured Oracle VirtualBox with DB, user and populated a small DB. In the same machine I've installed Pentaho Data-Integration(Spoon), the JDBC driver and I'm trying to create a connection to Oracle DB but without success. This is where I'm typing the credentials/data:

Host Name: localhost

Database Name: (DESCRIPTION=(ADDRESS_LIST=(ADDRESS=(PROTOCOL=TCP)(HOST=localhost)(PORT=1521)))(CONNECT_DATA=(SERVICE_NAME=ORCL)))

Port Number: 1521

User Name: SYSTEM

Password: oracle

enter image description here This is the error message:

How can I configure it in order to connect Pentaho/Spoon to the Oracle DB? The oracle DB seems to be working fine, I've also tried with other users/databases that I created, but the result is the same.

0 投票
1 回答
1711 浏览

csv - Pentaho Kettle,无法在文本文件输入中设置字段默认值

我正在导入要在转换中处理的 CSV 文件。最初我使用的是 CSV 文件输入。后来我才知道我不能有任何空值。所以我切换到文本文件输入,因为它在字段选项卡中有一个默认列,应该设置一个“默认值,以防文本文件中的字段未指定(空)”

在此处输入图像描述

但是,当我使用 Null 值填充字段的默认列时。该字段在转换中保持为。知道我做错了什么。

0 投票
1 回答
1436 浏览

regex - Pentaho 过滤器正则表达式 Excel 输入

好的,所以我现在要做的是从 Excel 输入(所有字符串列)中删除所有信息,然后在这些列中,我想为其中一个列做一个特定的过滤器,在 NO_BIEN 列上更具体,这个具体表达。

[0-9]+(.[0-9][0-9]?)?

我进行过滤行操作并单击 REGEXP 过滤器,但我看不到在哪里可以粘贴表达式,因为我只能看到是否要添加字符串。

过滤行屏幕

0 投票
1 回答
496 浏览

cassandra - Pentaho Cassandra 输入:键空间中不存在列族

我正在尝试在 Pentaho Spoon UI 中设置来自 Cassandra 的输入步骤。但是当我尝试显示架构或运行任务时,我得到以下异常:

我可以使用 CQLSH 和 DevCenter 访问键空间中的表。我也尝试过其他键空间和表,只是为了得到同样的错误。

任何想法都将不胜感激,因为我似乎无法在此处或其他论坛中找到此问题的任何先前答案。

0 投票
1 回答
173 浏览

postgresql - 数据仓库事实表生成

目前,我正在构建基于我的 ODS 表和维度表的事实表。我的 ODS 表

1.dateWiseData

sid_date

总印象数

2.设备(手机,PC等)

sid_date

设备ID

设备名称

总印象数

3.AdvertiserData

sid_date

广告客户 ID

广告客户名称

总印象数

事实表

ID

sid_date

设备ID

广告客户 ID

总印象数

在这里,我们面临将所有三个表数据连接到单个事实表中的问题。在这种情况下,我们在每张桌子上都有三个不同的总印象数。但实际上表我们只是添加了单个总印象数。我们如何计算它然后加入。我们尝试了不同的连接技术人员,但没有找到完美的解决方案。

请帮助我们处理此案

0 投票
1 回答
2038 浏览

pentaho - 在单个 JVM 上运行多个 Kettle 转换

我们想使用pan.sh来执行多个水壶转换。在探索了脚本后,我发现它在内部调用了在 PDI 中运行的spoon.sh脚本。现在的问题是,每次新的转换开始时,它都会为其执行创建一个单独的 JVM(通过 .bat 文件调用),但是我想将它们分组以使用单个 JVM 来克服多个 JVM 对批处理施加的内存限制服务器。

有人可以指导我如何实现这一目标或与我分享文档/资源。

感谢您的出色工作。

0 投票
1 回答
89 浏览

javascript - Javascript:在数据库字段中查找星号

我正在检查 Pentaho 数据集成中的数据流,并且正在使用一些 Javascript。某些字段可能有一个星号作为值。所以我有:

所有值都设置为“A”,即使值不是“*”的字段也是如此。我努力了:

我知道我必须逃避它,只是不确定我应该如何将它写成正则表达式。

0 投票
1 回答
94 浏览

pentaho - Pentaho 中的同步共享定义

Pentaho 有没有办法创建一个同步的共享定义?

假设我们有一个源文件 s1,它用于两个转换 t1、t2。现在,假设我在 t1 中进行更改并在 s1 中再添加一列,我希望它也能反映在 t2 中。Pentaho 有没有办法做到这一点?

当我们在 Pentaho 中共享数据库连接时,所有更改都会反映在我们使用它的任何地方。我们也可以对文件做类似的事情吗(如果我正在创建文件的共享定义并将其存储在存储库中,然后在其他转换中使用它)?

谢谢你的时间。

0 投票
1 回答
7730 浏览

mysql - 连接数据库时出错:(使用类org.gjt.mm.mysql.Driver)语句(1)没有打开游标

我正在开发 Pentaho 数据集成工具 5.2 版。我正在尝试使用“表格输入”步骤连接到数据库。但是当我在此步骤中测试连接时,它会给我以下错误消息。我可以使用 MySQL 工作台连接到数据库。我已将“ mysql-connector-java-5.1.38-bin”文件放在文件夹中libext

我需要降级我的连接器 jar 文件吗?如果是,我的 SQL 版本是 5.6,那么有人可以告诉我此 SQL Server 版本的兼容连接器 jar 版本吗?

0 投票
2 回答
1111 浏览

pentaho - 数据库存储库 (Oracle) 与文件系统作为 Pentaho 的存储库

我想在我的工作中使用 Pentaho。经过一番研究,我发现要存储 ktr/kjb 文件,我可以将数据库作为存储库,也可以将文件系统用作存储库。但是,我没有发现将数据库用作文件系统的存储库的任何好处。这里存储库的基本目的是创建一个通用位置,我可以将所有已开发的 ktr/kjb 文件保存在生产环境中。基本上,如果我考虑数据库存储库,它将在生产中保存所有已开发的 ktr/kjb 文件,并且每次我需要运行作业/转换时,我都会连接到数据库以获取相应的 ktr/kjb 文件(类似于 informatica 存储的方式另一方面,基于文件的存储库就像一个包含所有已开发文件的文件夹。

这里有人可以解释这两种存储库的优缺点吗?

如果您需要任何其他信息,请告诉我。

提前致谢。